2021年第二届“大湾区杯”粤港澳金融建模竞赛B题解题思路和部分代码_粤港澳数学建模竞赛b题怎么写的-程序员宅基地

技术标签: 数学建模  笔记  机器学习  

概要:

金融建模类的竞赛难度真的很大,其数据处理程度堪比大数据类比赛;其建模能力要求堪比深圳杯,编程能力要求堪比含金量普通或中上的算法比赛。还需要有及其扎实的金融知识背景(没错,我不会。我就一计算机专业的)。**此比赛不推荐单人参赛、不推荐建模小白参赛。**这次博主单人完成的作品是B题的本科组三等奖。

使用的编程语言和工具:PYTHON,MATLAB,聚宽量化平台
关键词:特征工程 多因子选股模型 BP神经网络 历史数据法

题目回顾:

首先,这个金融建模的题目就已经吊打国内大部分数学建模比赛了,8天的比赛。B题光题目打印出来就整整3页。A题更多。。
概括来说,B题的问题是这样的:
券商研报(卖方研报)是指证券公司的研究人员对证券及相关产品的价值, 戒者影响其市场价格的因素迚行分析,所作出的研究报告。完整的券商研报,包含对证券迚行综合分析,总结出关于上市公司、行业戒宏观政策的看法,并对相关股票迚行投资评级等。
商提供的典型公司研报可能会包括:公司的相关数据、经营情况、重大事件、重要信息,以及关于公司的盈利预测与投资建议,公司的财务预测数据、估值结果与风险提示等。还可能会给出相关报告评级、历史推荐等级和目标价等。
综合研究券商研报和外部环境对证券公司股票走势的影响,请建立数学模型完成下列仸务:
(1)请在湾区指数的 30 支股票中,选取 10 支湾区股票的券商研报,提取研报的特征指标。
(2)对选择的 10 支湾区指数股票,建模分析研报特征指标对股票走势的影响, 并提出明确的投资策略。
(3)建模研究突发事件的闪现、舆情和自然灾害因素等对选择的 10 支湾区指数股票行情的影响。
(4)综合建模分析券商研报和外界环境因素对证券公司股票走势的影响,修改仸务(2)的投资策略,并提出新的投资策略。

说实话,8天8夜的比赛,我花了3天研究题目。导致后期发力不足直接投资策略直接放到上证上跑的效果不是很好。

咳咳,下面是解题思路了!

解题思路:

问题一:

问题一要求在题目提供的30支股票中,选取10支股票并对它们各自的研报进行特征指标的提取。首先,鉴于研究券商研报对股票走势的影响的合理性以及后续模型建立的普适性,随机选取10支股票,其名称及股票代码分别为:分众传媒(002027)、亿纬锂能(300014)、生益科技(600183)、华侨城A(000069)、中国平安(601318)、瀚蓝环境(600323)、格力电器(000651)、粤水电(002060)、中顺洁柔(002511)、白云山(600332)。其次,对于研报的选取,因为不同证券公司撰写的研报,其对股票研究的侧重点以及对股票走势预测建立、使用的模型也迥然不同。经思考,可得:券商研报的内容可以帮助投资者更好地掌握市场动态,和新闻媒体一样,具有一定的实时性。那么,发布日期最新的研报,其内容和给出的特征指标无疑对后续未来投资策略的制定有着最有代表性的参考意义,因此,选取本文撰写日期(2021年11月2日)之前以上10支股票最新发布的研报为研究对象,进行特征指标的提取。然后,根据题意可知,典型研报可以提供如市盈率、市净率、毛利率等特征因子的信息,但我们不认为这是研报的专属的“特征指标”,一般来说,研报中的词语出现的频率在一定程度上会反映撰写者对该词语的重视程度(“你”,“我”等常用词除外),词语出现的频率越高,说明该词语一定程度上蕴含了更多的撰写者想要表达的信息和思想。综上所述,提出研报的特征指标的定义:
1.特征指标是券商研报中出现一定频率的词语。
2.特征指标也是典型研报可以提供的特征因子。
对研报进行基于特征工程的文本特征提取,获得研报的特征指标。
对研报进行特征提取的代码如下(PYTHON,只给个例子,10支股票都贴出来估计过不了审,研报来源:发现报告)

# coding=utf-8
import jieba
from sklearn.feature_extraction.text import CountVectorizer
def cut_word(text):                                   #进行分词处理
    text = ' '.join ( list ( jieba.cut ( text ) ) )
    return text
def cut_chinese_demo2(data):                              #进行简单的词频统计,粗略地反映研报中最有特征性的词汇

    data_new = []
    for sen in data:
        data_new.append ( cut_word ( sen ) )
    transfer = CountVectorizer ()
    data_final = transfer.fit_transform ( data_new )
    print ( "data_new:\n", data_final.toarray () )
    print ( "特征名字:\n", transfer.get_feature_names () )

data7=["亿纬锂能 (300014)——储能电芯获关键测试突破,持续完善上游布局"
"事件:2021 年前三季度,公司实现营业收入 114.48 亿元,同比增长 114.39%;实现归母净利润 22.16 亿元,同比增长 134.18%;实现基本每股收益 1.17 元/股,同比增长 129.41%。"
"投资要点:业绩略低于市场预期, 累计营收突破百亿大关。2021 年前三季度,公司实现营业收入"
"114.48 亿元,同比增长 114.39%,主要系随着新建产能持续释放,为满足客户需求,公司电池出货规模增长较大所致;实现归母净利润 22.16 亿元,同比增长 134.18%;实现基本每股收益 1.17 元/股,同比增长 129.41%。2021 年第三季度,公司实现归母净利润 7.21 亿元,同比增长 23.70%,环比下降 14.98%;单季度销售毛利率为 21.55%,环比下降 2.4 个百分点,我们认为主要系原材料涨价带来的成本压力所致。"
"国内领先的动力电池厂商,储能电芯获关键测试突破。根据中国汽车动力电池产业创新联盟统计,2021 年 1-9 月,我国动力电池累计装机量为 92.03GWh,其中亿纬锂能装机量为 1.70GWh,市占率为 1.8%,位居国内第七;2021 年 9 月,我国动力电池装机量为15.69GWh,其中亿纬锂能装机量为 0.26GWh,市占率为 1.6%。2021 年 5 月,公司子公司亿纬动力 LF280K 储能电芯获得了祐力(中国)投资有限公司出具的 UL9540A 测试报告,该报告是北美储能项目开发商或业主在提交相关项目审批流程时所需的一份关键第三方报告,本次获得报告有望助力亿纬动力更好地开拓国际储能市场,对扩大产品国际影响力和海外市场业务具有积极作用。"
"相关研究 证券分析师 张雷 A0230519100003 [email protected] 研究支持 陈明雨 A0230120040001 [email protected] 黄华栋 A0230120050002"
"[email protected]"
"联系人"
"黄华栋(8621)23297818×转"
"[email protected]"
"0%"
"-50%"
"拟与中科电气设立合资公司,持续完善上游布局。公司拟与中科电气签署《合资经营协议》拟合作设立合资公司,其中公司认缴 40,000 万元,持有合资公司 40%股权;中科电气认缴 60,000 万元,持有合资公司 60%股权。该合资公司将专注于为负极材料制造,并优先向公司及其子公司供应。项目计划投资总额为人民币 25 亿元,负极材料年产能 10 万吨, 采用分期建设模式,一期和二期产能规模各为 5 万吨/年。本次合作有利于公司持续完善上游电池原材料产业链布局,稳定原材料供应,降低采购成本,打造更具技术、成本竞争优势的锂电池产品。"
"维持盈利预测,维持“买入”评级:公司是优质的锂电池科技公司,动力电池快速放量, 储能电池有望形成新的增长曲线。我们预计 21-23 年公司归母净利润分别为 32.20、44.81、"
"57.40 亿元,对应 EPS 分别为 1.70、2.36、3.02 元/股,当前股价对应的 PE 分别为 64 倍46 倍和 36 倍。维持“买入”评级。"
"风险提示:全球电动化进展不达预期;动力电池价格下跌超出预期。财务数据及盈利预测"
"注:“市盈率”是指目前股价除以各年每股收益;“净资产收益率”是指摊薄后归属于母公司所有者的 ROE"
"请务必仔细阅读正文之后的各项信息披露与声明"
"财务摘要"
"百万元,百万股	2019A	2020A	2021E	2022E	2023E"
"营业总收入	6,412	8,162	15,741	22,881	29,238"
"其中:营业收入	6,412	8,162	15,741	22,881	29,238"
"减:营业成本	4,506	5,794	11,350	16,559	21,188"
"减:税金及附加	47	39	75	110	140"
"主营业务利润	1,859	2,329	4,316	6,212	7,910"
"减:销售费用	175	226	441	641	819"
"减:管理费用	189	270	519	686	877"
"减:研发费用	459	684	1,198	1,373	1,462"
"减:财务费用	95	60	95	80	48"
"经营性利润	941	1,089	2,063	3,432	4,704"
"加:信用减值损失(损失以“-”填列)	-89	-82	0	0	0"
"加:资产减值损失(损失以“-”填列)	-86	-22	36	-60	-60"
"加:投资收益及其他	867	944	1,500	1,701	1,900"
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/SkyfromGD/article/details/121980980

智能推荐

安装centos7之后要做的几件事_centos libtoolize-程序员宅基地

文章浏览阅读5.5k次,点赞3次,收藏6次。本文主要记录安装Centos7之后要做的几件事,作为备忘一 安装第三方源:(此处以aliyun为例)ps:本文所配置环境均为root权限下,如需在普通环境下配置,命令之前请加上sudoEPEL源: yum install epel-release执行完该命令后,在 /etc/yum.repos.d 目录下会多一个 epel.repo 文件ELRepo 源ELRepo 包含..._centos libtoolize

echarts 显示下载按钮,echarts 自定义按钮,echarts 添加按钮-程序员宅基地

文章浏览阅读2.5k次。echarts 显示下载按钮,echarts 自定义按钮,echarts 添加按钮 >>>>>>>>>>>>>>>>>>>>>>>>>>&_echarts 图标上的下载按钮不能用

el-table表头添加图标_el table 表头加图片-程序员宅基地

文章浏览阅读149次。el-table的表头添加特殊内容。_el table 表头加图片

如何防止网页的背景图片重复 no-repeat_网页重复背景-程序员宅基地

文章浏览阅读1.2w次。(1)现在一般都用css设定了,比如在一个div下设背景图片切不让其重复,则可设一个样式,比如:.nobgrepeat{background:url(背景图片地址) left top no-repeat;}(2)也可以设置背景图片的高宽,要与背景图片的大小一样注意:但是有时候加了 no-repeate之后,图片就会不见了,这种情况与设置的 left _网页重复背景

计算机网络的性能指标以及相关计算_计算机网络数据率计算公式-程序员宅基地

文章浏览阅读1.5k次,点赞2次,收藏17次。用来表示网络的通信线路所能传送数据的能力,因此网络带宽表示在单位时间内从网络中的某一点到另一点所能通过的"最高数据率"单位和速率一样:b/s(kb/s,Mb/s,Gb/s);RTT计算公式:因为是从发送方发送完数据才开始计算的所以公式中并没有结点A的发送时延,但是有结点B的发送时延;结论:若主机在一段链路上连续不断的发送分组,则总时延为所有分组的发送时延+信号在这一段链路上的传播时延;吞吐量受网络的带宽或额定速率的限制;分组丢失率,是指在一定的时间范围内,传输过程中的丢失的分组数量与总分组数量的比率;_计算机网络数据率计算公式

012信息打点-Web应用&企业产权&指纹识别&域名资产&网络空间&威胁情报_资产指纹和应用-程序员宅基地

文章浏览阅读188次。针对各种应用的信息收集(Web网站、APP应用、PC应用、小程序应用、微信公众号等企业资产分五类:Web应用、APP应用、PC端应用、小程序应用、微信公众号、其他产品信息收集目标:某某企业、某某学校、网址、ip地址_资产指纹和应用

随便推点

《QT从基础到进阶·三十五》QT插件实现侧边工具栏tabBar_qt侧面工具栏-程序员宅基地

文章浏览阅读655次,点赞3次,收藏4次。内部先拿到TabBar的dll转为QObject,再把QObject强转为TabBarPlugin对象,这是插件的使用方法,也可以直接new一个TabBarPlugin对象。四个小工具也是由插件实现,先拿到他们的对象,通过对象指针获取他们的界面,再把每个界面addWidget添加到标签栏中。(2)调换tabBar标签栏中所有界面的循序和删除小工具界面。(3)把tabBar标签栏中的小工具界面拖出来在放回去。3、现在可以对标签栏上的所有界面进行交互。(1)可以收缩和展开tabBar。_qt侧面工具栏

Microsoft Office LTSC 2021企业办公新标杆,稳定高效助力业务发展-程序员宅基地

文章浏览阅读267次,点赞4次,收藏10次。总的来说,Office套件的功能特色在于其强大的文档处理、数据分析、演示制作和邮件管理等功能,以及各应用程序之间的协同工作,能够极大地提高用户的工作效率。除了上述三个主要应用程序外,Office套件还包括其他应用程序,如Outlook、OneNote、Publisher和Access等,每个应用程序都有其独特的功能特色,满足用户在不同场景下的办公需求。Office是一款功能强大的办公软件套件,包含了多个应用程序,每个应用程序都有其独特的功能特色。

Elasticsearch--解决JVM 堆内存使用率很高的问题_elasticsearch8占用大量内存-程序员宅基地

文章浏览阅读2k次,点赞22次,收藏16次。本文介绍如何解决ES的JVM 堆内存使用率飙升的问题。_elasticsearch8占用大量内存

《Selenium 2 自动化测试实战》读书笔记_selenium2自动化测试实战-程序员宅基地

文章浏览阅读136次。最近在弄 appium,然后顺便发现了 Selenium 框架和这本书,恰好这本书也介绍了一些软件测试 & 自动化测试的理论知识,遂拿过来学习学习。所以本文几乎没有实践内容,大多都是概念和工具的 mark,后续若有实践,我会来补充的。_selenium2自动化测试实战

树莓派4B 与 stm32 通信_树莓派4b 与 stm32 采用usb-ttl通信-程序员宅基地

文章浏览阅读1.7w次,点赞33次,收藏486次。本文用来记录智能控制课设中的通信环节的实现硬件便是树莓派4Bstm32(我用的是正点原子的STM32F103ZET6的核心板)从头开始做的,带着你去从烧录树莓派,安装STM32的编译环境开始,直到二者成功通信。如何使用串口助手进行调试,以及如何通过代码进行通信。1.准备环节(树莓派已经烧录好镜像可以正常使用,stm32也已经装好keil5的同学可以略过)1.1 树莓派新买的树莓派4B一般TF卡没有烧入镜像(也就是树莓派的操作系统)官方推荐系统是以下三种32位Lite版(无桌面)32位桌面版_树莓派4b 与 stm32 采用usb-ttl通信

Ubuntu系统下JDK环境切换_ubuntu切换jdk-程序员宅基地

文章浏览阅读251次。请注意,如果系统上没有安装Java,你将看到一个类似"command not found"的错误信息,这意味着你需要先安装Java。如果你需要切换到一个新的Java版本,首先需要安装该版本。这将列出系统中已安装的Java版本,并要求你选择默认的Java版本。完成上述步骤后,你已经成功安装并配置了新的Java版本。如果需要切换回先前的Java版本或者安装其他版本,重复步骤2和步骤3即可。首先,我们需要检查系统上已安装的Java版本。接下来,需要配置系统使用新安装的Java版本。_ubuntu切换jdk