
本文介绍了华科、华南理工等联合发布的SPTS v2,该文本检测识别框架速度提升了19倍。近年来,场景文本阅读技术取得显著进步,能够同时定位和识别文本,在智慧办公、金融、交通等领域得到广泛应用。相较于目标检测,文本除了定位还需要精确识别内容,并且由于字体和排版的差异,文本实例可能呈现出任意形状,因此需要更多坐标的边界框来标注。该文分析了为了解决这一问题,单点文本框标注技术的重要性以及使用并行解码来提升自回归速度的方法。文章还提供了原文链接以及作者联系方式,作者简介中介绍了作者微信号为AI_era,是智能+中国主平台的创始人,致力于促进中国从互联网+向智能+新时代的发展,关注人工智能、机器人等领域的发展趋势。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...