(相关资料图)
近日,彭博发布一篇关于BloombergGPT开发情况的研究论文《BloombergGPT:ALargeLanguageModelforFinance》,文章详细介绍了这一全新的大规模生成式人工智能(AI)模型。该大语言(LLMLLM)专门针对各类金融数据进行训练,以全方位支持金融领域的自然语言处理(NLPNLP)任务。
该模型将帮助彭博改进现有的金融NLP任务,如市场情绪分析、命名实体识别新闻类和问题回答等。此外BloombergGPT还为训练BloombergGPT,彭博构建了一个全面的数据集“FINPILE“,主要由英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件,以及从彭博档案库中提取的社交媒体消息。
同时彭博将FINPILE与公共数据集进行叠加,成为了包含超7,000亿词例(的大型训练语料库,其中彭博“贡献了3635亿词例(tokens),占比51.27%51.27%,且该部分的数据质量更高。
图表为完整的训练集的分类。(来源:《BloombergGPT:ALargeLanguageModelforFinance》)
Copyright © 2015-2022 南极经贸网版权所有 备案号:粤ICP备2022077823号-13 联系邮箱: 317 493 128@qq.com