合合信息丁凯博士:以智能文字识别技术挑战传统OCR应用难题
【TechWeb】8月24日消息,近期,2022中国图象图形大会(CCIG 2022)在成都落幕,本次大会由中国科学技术协会指导,中国图象图形学学会主办,四川大学承办,电子科技大学协办,汇聚了百余位国内知名学者,以及来自百度、华为、OPPO、合合信息等企业的技术专家,共话图像图形学术研究与技术创新趋势,共谋行业新发展。
合合信息自然语言算法研发总监丁凯博士认为,尽管OCR技术已走过一个世纪的发展,现今仍存在文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差等亟待解决的问题。OCR技术的进阶之路上,文档图像质量的增强是重要的研究方向,需克服页面弯曲、阴影遮挡、摩尔纹、图片模糊等现代文本图像处理中常见的干扰状况。通过引入AI(人工智能)技术,合合信息智能文字识别及图像处理技术能够帮助各应用领域简化下游文档处理任务,提升文字识别效率与准确性。
以弯曲矫正为例,丁凯博士介绍了基于文本行线拟合和坐标变换、基于文本行线优化矫正的方法原理和优缺点,并提到合合信息采用的基于位移场网络学习的方法的系统架构,可有效解决多种弯曲文档图像的矫正问题。除此之外,在教育领域,合合信息“字迹擦除”技术融合了内容切分、手写字迹分离网络、文档质量增强技术,对复杂场景进行准确处理,实现作业及试卷笔记“一键擦除”。
另外一方面,文档数字化流程的建立是加速企业数字化转型的关键,也是技术落地中的痛点。为了更好地解决不同业务中存在的文档版式繁杂、训练样本匮乏、模型定制化调优周期长且效率低的问题,合合信息推出了TextIn Studio智能文字识别训练平台,可将底层资源、数据、模型训练、集成部署和服务管理应用多个模块整合在一起,针对性解决各项问题的同时,建立业务流程之间的闭环,实现模型自动化训练和部署。
大会还举行了第三届CSIG图像图形挑战赛总决赛颁奖仪式。CSIG图像图形挑战赛旨在促进我国图像图形技术及相关产业的发展和应用,解决企业面临的技术难题,帮助企业引入更多的优秀人才。本次大赛吸引了来自高校、科研机构、企业的上百支参赛队伍参与。凭借在视觉关键信息理解层面的算法优势与多语言票据识别场景的实践沉淀,合合信息与高校及企业生态伙伴组成的参赛队伍继获得“中英文购物小票信息理解赛道”单项冠军后,通过终轮现场比拼,获得CSIG图像图形技术挑战赛总冠军。
您可能也感兴趣:
官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
去哪儿2023春节报告:出境机票同比增长6.7倍
2023春节档总票房破60亿 《满江红》领跑
马斯克预计特斯拉皮卡Cybertruck 2024年量产 晚于此前预期
交易量被指夸大6至10倍 满帮回应做空报告:与事实不符
特斯拉降价带动需求大增 马斯克:1月订单量超产量两倍
特斯拉第四季度营收243.18亿美元 汽车交付405278辆同比增长31%
理想L9车主爆料高速NOA辅助驾驶失效致车辆追尾 李想回应
法拉第未来FF 91正进行最后调试工作 未来将重点聚焦国内市场
亿纬锂能拟新建、扩产多个动力电池生产基地
更多
- 苹果首款AR/MR头显有望配备4K OLED屏幕 15套摄像头模组
- 玉晶光电将为苹果AR/VR头显供应镜头模块 最早下月开始出货
- 机构称三星电子去年仍是全球营收最高半导体供应商 但同比有下滑
- 机构预计去年全球半导体营收超过6000亿美元 但同比仅增长1.1%
- 韩媒:LG新能源计划在3年内开发出锂硫电池
- 推特经理:自马斯克接管以来 已有500多家广告商逃离推特
- 业内人士:台积电5/4nm工艺产能利用率在Q2可能降至70%以下
- 消息称Shein正洽谈融资至多30亿美元 公司估值缩水36%
- 特斯拉已成全球第9大最有价值品牌 TikTok/抖音紧随其后
- 亚马逊启动有史以来规模最大一轮裁员 预计波及全球1.8万名员工