跟我读论文丨Multi-Model Text Recognition Network

2022-08-22 08:39:21

摘要：语言模型往往被用于文字识别的后处理阶段，本文将语言模型的先验信息和文字的视觉特征进行交互和增强，从而进一步提升文字识别的性能。

本文分享自华为云社区《Multi-Model Text Recognition Network》，作者：谷雨润一麦。

语言模型经常被用于文字识别的后处理阶段，用来优化识别结果。但该先验信息是独立作用于识别器的输出，所以之前的方法并没有充分利用该信息。本文提出MATRN，对语义特征和视觉特征之间进行跨模态的特征增强，从而提高识别性能。

方法

方法的流程图如上图所示，首先图片通过视觉提取器和位置注意力模块得到初步的文字识别结果。然后将该识别结果通过一个预训练好的语言模型，得到文字的语义特征。

接着通过上图左所示的模块，利用transformer进行视觉特征和语义特征的特征增强。最后利用如下公式，将视觉特征和语义特征进行特征融合，并进行最终的分类。

值得注意的是，有感于自监督的方法，本文也提出了一种在视觉特征图上加掩码的方法。具体来说，利用位置注意力模块中的注意力相应图，随机选择某个时刻的注意力权重作为掩码，mask掉一部分视觉特征。

实验结果

从实验结果可以看出来，该方法在比较困难的不规则图像中有较大提升。这说明当模型很难从视觉上进行识别的时候，文字之间的语义特征有助于识别。

点击关注，第一时间了解华为云新鲜技术~

作者：华为云开发者联盟
原文链接：https://huaweicloud.blog.csdn.net/article/details/125913741
更新时间：2022-08-22 08:39:21

相关文章

ResponseBody与RequestBody[转]
1. ResponseBody@ResponseBody的作用其实是将java对象转为json格式的数据。@r
2022-09-14

从零开始学 Python 之 filecmp&difflib
本节主要介绍两个 Python 中常用于比较数据的模块，一个是 filecmp 模块，另一个是 difflib
2022-09-15

python 映射盘,Python内存映射文件读写方式
我就废话不多说了，还是直接看代码吧！import osimport timeimport mmapfilena
2022-09-15

详解python中的yield（生成器）
yield1.yield与return的异同2.yield使用的好处3.具体实例理解实例一实例二实例三1.yi
2022-09-15

随机文章

python 各种进制之间转换函数
文章目录1、其它进制转10进制整数2、10 进制整数转 2 进制3、10 进制整数转 8 进制4、10进制
2022-10-21

securecrt连接虚拟机提示账号密码错误
securecrt解决账号密码错误问题
2022-10-21

zabbix5.0监控mysql服务
zabbix5.0监控mysql_status.ping服务
2022-10-21

PyQt5定时器QTimer的简单操作
当代程序中需要显示时间时或者需要在程序中周期性地进行某项操作，就会用到定时器。PyQt5就提供了一个定时器QT
2022-10-21

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录