3月18日,由中国图象图形学学会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG企业行”系列活动成功举办。
“CSIG企业行”是中国图象图形学学会主办的走进企业系列活动,旨在充分利用学会专家资源,搭建学术界与企业交流合作平台,为企业创新发展提供科技支撑,为图像图形领域高校师生提供与企业互动机会,共同推动图像图形领域的发展。
据悉,此次活动以“图文智能处理与多场景应用技术展望”为主题,聚焦图像文档处理中的结构建模、底层视觉技术、跨媒体数据协同应用、生成式人工智能及对话式大型语言模型等热门话题,特邀来自上海交大、复旦、厦门大学、中科大的顶尖学府的学者与合合信息技术团队一道,分享文档处理实践经验及NLP发展趋势,探讨人工智能与文档处理未来。
活动中,合合信息董事长、总经理镇立新博士与CSIG文档图像分析与识别专委会主任金连文教授分别进行了致辞。随后,各学者针对人工智能进行了专业分享。
上海交通大学人工智能研究院常务副院长、国家杰青、IEEE Fellow杨小康教授进行了《生成式人工智能与元宇宙》主题分享。杨小康认为,以“识别-分析”为代表的判别式人工智能推动了人工智能前十年的发展,接下来十年,以“合成-重建”为代表的生成式人工智能将成为主流。
复旦大学计算机学院教授、国家优青、上海市计算机学会自然语言处理专委会主任邱锡鹏进行了《对话式大型语言模型》主题分享。“文本所承载的知识只是冰山一角,还有很多‘暗知识’并不是以文本形式记录的。在未来的发展里,人工智能还有‘具身学习、跨模态学习’等更多知识领域需要学习。”邱锡鹏说。
厦门大学人工智能研究院负责人、国家杰青纪荣嵘教授进行了《复杂跨媒体数据协同分析与应用》主题分享。纪荣嵘指出,连接视觉与自然语言的“视觉描述”领域,是最受关注且最具潜力的人工智能研究任务之一 。视觉和语言的研究应是双向的,各自的新发现、新方法可以互相迭代促进。跨空间、跨领域、跨任务知识迁移方面有较大探索空间,易于发现新的科学问题。
合合信息图像算法研发总监郭丰俊也进行了《文档图像处理中的底层视觉技术》主题分享。郭丰俊提到,合合信息智能文档处理技术基于对图像目标区域的精准裁剪,对弯曲、倾斜透视的页面进行形变矫正,在去除阴影、摩尔纹后,通过人工智能技术对文档图像进行增强锐化和清晰度提升,达到“图像质量增强”的效果,在改善阅读体验的同时,也提升了识别转换、图像分析等文档处理下游任务的质效。
据悉,合合信息是一家人工智能及大数据科技企业,专注于智能文档处理底层技术及应用产品的研究工作,重点关注图像质量优化、版面还原、复杂场景文字识别,文档理解,数据“知识化”等方面。
公开资料显示,合合信息“复杂场景文档图像识别与理解关键技术及应用”项目被中国图象图形学学会科技成果鉴定会委员认为“在复杂场景文档图像识别与理解技术方面取得了创造性的成果,并具有自主知识产权,整体技术达到国际先进水平”。