合合信息亮相第十二届中国智能产业高峰论坛

怎样治白癜风 https://m-mip.39.net/disease/mip_5781078.html
近日，为期两天的第十二届中国智能产业高峰论坛（CIIS）在江西南昌顺利举行。大会期间，中国人工智能学会（CAI）模式识别专委会与合合信息共同承办了《多模态大模型与文档图像智能理解》专题论坛，来自清华大学、华中科技大学、复旦大学、百度、科大讯飞、合合信息等研究机构和企业的技术专家，围绕行业焦点议题展开探讨。作为一家在人工智能及大数据领域深耕十余年之久的“老兵”，合合信息基于自主研发的智能文字识别及商业大数据核心技术，由人工智能与模式识别技术科学家镇立新领导公司研发团队完成名片全能王、扫描全能王系列产品的研究开发，为全球用户和多元行业客户提供数字化、智能化的产品及服务，主要产品包括面向C端用户的扫描全能王APP、名片全能王APP、启信宝APP及相关小程序，以及面向B端客户的基础技术服务、标准化服务和场景化解决方案的业务服务。专题论坛上，合合信息智能技术平台事业部副总经理、高级工程师丁凯博士在《文档图像预训练模型的探索与思考》分享中指出，在互联网语料“见底”之日逐渐逼近之时，电子书成为了大模型训练的新“燃料”，而电子书很多是由文档图像组成的，文档图像识别分析与智能理解技术可以将大量的文档图像转化为具有丰富格式信息的文本，为大模型提供更丰富更高质量的训练语料，解决大模型训练的“token荒”的问题。文档图像技术作为起步较早、发展较为成熟的人工智能技术领域，当前仍存在着文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差等亟待解决的问题。丁凯认为，文档图像处理技术在推动大模型技术发展的同时，大模型的小样本学习能力、多任务能力、智能涌现能力对于文档图像处理问题的解决具有重要的研究价值。“在已有的学术研究中，文档图像专有大模型在更复杂的文档理解问题上存在天然的短板，而一些多模态大模型已经表现出了从含有表格、图片等多重元素的文档中提取关键信息进行分析，理解内容的潜力。”丁凯表示，研究人员可以基于现有的领域做更好的融合，开辟新的研究方向。（刘翔）

转载请注明：http://www.abuoumao.com/hytd/5326.html

上一篇文章：东亚商务论坛携手共促区域经济全面复苏

下一篇文章：没有了