点击展开

大数据挖掘

OB电竞:顶流投资条记 量化投资司理叙文本开掘正在因子开垦中的行使
2022-09-07 00:29:48 | 来源:OB电竞官网 作者:ob电竞官网下载

  正在评估一个量化模子的对比上风时,咱们时时会考量它正在因子贮藏上所能到达的深度和广度。由于唯有因子积蓄得足够多,才有机缘具备正在职何庞大的商场情况下都能获取阿尔法回报的大概性。但跟着量化投资的繁荣进入到一个相对成熟的阶段,大个别有用因子都已成为各家量化团队的标配,思要正在古代数据框架下开垦新的阿尔法因子依然愈发贫穷。然而近年来渐渐振起的人为智能技巧却为新因子的开垦掀开了视野,本文就首要先容文本发现技巧正在因子开垦中的极少操纵案例。

  起月朔个轻易的案例即是能够通过文字成亲的办法来判决一篇考虑讲演的投资方向。譬喻咱们要从一篇解析师所撰写的考虑讲演中会意到他对这家上市公司的见识到底是正面或是负面,甚至引荐力度怎么,咱们平常会从该解析师熟手文中的语义表达去举办感性认知。但明确咱们没有足够的精神去阅读完全解析师和完全上市公司的闭系研报,那么通过文字成亲的措施来举办朦胧判决就不失为一个次优选取。譬喻咱们能够正在每一篇研报中去寻求依然被咱们界说为“正向”或“负向”的字眼,进而对该解析师正在该公司上的投资方向举办评估。“正向”的字眼能够搜罗“引荐”、“利好”、“刷新”和“强劲”等,“负向”的字眼能够搜罗“低于预期”、“不足预期”、“下行”和“停息”等。假使不行说通过轻易的文字成亲就能准确地胸襟解析师的投资方向,但正在纳入完全解析师和完全上市公司的闭系研报后,差错依旧也许渐渐降落到一个能够采纳的限度之内,咱们据此也就能够开垦出像解析师引荐度等一系列因子。

  更庞大的文本发现技巧则需求应用到像音讯、论坛、微博等舆情数据上。由于这些新闻渠道不存正在团结、模范化的措辞表达办法,因此不行操纵轻易的文字成亲措施去举办判决(云云只会导致大方的漏判和误判),而需求引入一个叫做“感情解析”的文本解析用具。感情解析也能够被贯通为一个文本解析的黑箱子,只消向这个箱子输入一段文字,他就能够输出相应的文本解析结果,譬喻这段文字的感情颜色怎么,是笑观依旧绝望等。当然,探究到中文措辞的广博精辟,感情解析的准确度难以无尽定趋近于100%,但值得断定的是,这个黑箱子平常也具备屡屡迭代和优化的才具,因此跟着体会的累积咱们终能够获取能尽大概让咱们舒服的解析结果。通过对语义显然的文本数据举办统计解析咱们又能够分娩出诸如投资者体贴热度、看好水平等一系列舆情因子。

  最终,从上市公司布告中咱们也能通过文本发现的办法获取到极少存脑筋的另类数据。譬喻有些上市公司会披露其与其他公司缔结的合同或竣工的同意等新闻,咱们就能够通过文本发现的办法将这些新闻给抓取下来,然后搭筑模范化的上市公司相闭数据库,正在此中纪录业务两边新闻、合同金额、业务工夫等新闻,云云就能够便于咱们对由某一家上市公司延张开的悉数供应链汇集举办全貌解析,也能藉此开垦相应的选股因子。以上均是文本发现技巧正在因子开垦中的极少案例浮现,的确考虑目标另有许多,就不逐一张开了。

ob电竞官网下载
OB电竞官网

ob电竞官网下载

联系电话:176 0301 6881

邮箱:sales@finscm.com

OB电竞官网