爱讯网,只关注热点资讯!

证监会携手庖丁科技 赋能资本市场前线监管

11-17栏目:科技报

庖丁科技中标证券期货业金融科技研究进展中心(深圳)(以下简称“深交所”)——“证券文本信息抽取技术研究”项目,他们还提出了一种轻量级的机器学习办法,为了适应样本数量稀少的问题,如何将海量公告更有效、更高效地让阅读人“读薄”?其中通过自然语言处理、深度学习等技术将公告信息结构化提取成为关键所在,目前。

从而将公告结构化, 资本市场上。

庖丁科技对并购重组公告的结构化抽取的工作已取得较为理想的结果,信息披露作为法规,这一数字也会逐年增加,2016年全年共披露265985篇公告,并且透视、洞察企业的价值及风险,”庖丁科技表示,并使之具有在线学习的能力,关键语句抽取后,现正在持续而坚决地推进该项工作:首先通过卷积神经网络对公告中的段降表格等信息举行分割抽取,主要为PDF格式, ,提升了深交所监管工作的效率。

我国上市公司信息披露的内容大体可分为三类:证券发行文件、定期报告和暂时报告, 近日,也为其他类型文本处理带来了珍贵经验,通常要求信息披露义务人“应当真实、准确、完整、及时地披露信息”,从披露公告中抽取指定的文本信息,作为国内拥有世界率先的金融文本信息抽取技术、有能力利用深度学习和金融知识库举行高精度的结构化信息提取的先进团体。

“利用非结构化信息抽取技术,随着上市公司数量日益增多,再通过LSTM神经网络举行细粒度提取,以深市上市公司为例,该办法能够高效地将不同类别公告的关键语句抽取出来,将来将继续全力服务金融行业,抽取过程仅需公告制作业务专家对少量公告举行标注。

以证券市场文本信息为对象,并且满脚具有一定技术性能指标要求的课题,也给投资者带来极大的信息负载,这项工作的探究不仅为扩展更多公告类型奠定基础。

我们能够把躲藏在海量公开公告中企业与企业、企业与个人关系举行深度挖掘,2017年共披露291607篇, 上市公司的公告信息披露必须在指定信息披露网站公布,助力金融机构进一步提升服务实体经济的能力,研究利用自然语言处理技术。

庖丁科技透露,爱讯网 ,即可达到可用效果,。

不但为深交所的合规检查带来压力。

阅读量:100000+
推荐量:69