本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请筹商出处。
好多人日常在用的智高人表,它的文本输入要么靠语音,要么靠打字或手写。

但未必你可能不浅近谈话,粗略在那么小的屏幕上戳键盘确凿有点“褊狭”。
那咋办?
也许可以试试“隔空打字”法。
浙江大学就开发了这么一个名叫AirText的诈欺,只需你动开头指和手腕,腕表就确识别空中字符,特别率低至3.9%。
还配备梦想和推选功能,让拼写速率更快。
给智高人表配上“隔空打字”功能
开发AirText的一个主要挑战在于如何让它一语气手腕知晓和指尖拼写动作的对应关系。
就像底下这张图所展示的,拼写时手腕呈现出来的轨迹和平方字母差得还挺多的。
为此,谈判团队先借助了一个现成器用Leap Motion,它可以用红传闻感器追踪手势。
然后八名志愿者使用五种不同的智高人表拼出卓著25000个字符,用Leap Motion采集干系的手腕和手指知晓数据。
再将数据输入神经蕴蓄模子,进行检会,最终AirText可以凭据用户手腕细小的动作变化估计指尖的轨迹。
然后,仅通过智高人表就可以高效、准确地将估计出的轨迹识别为相应的字符。
为了加速拼写速率,他们还给系统配上了单词展望和推选功能。
展望单词会显现在腕表屏幕的四个场所,咱们可以将腕表向险阻傍边歪斜就能进行采选(浪荡腕表可以退格)。
词特别率为3.9%
当先来看AirText的准确性测试。
讨论筹商为WER(词特别率,Word Error Rate),野心行动等于将特别字/识别正确的字。
其中特别字触及三种类型:漏字(用I示意,即校对成正确的拼写时需要再插入的字的数目)、多字(用D示意,即需要删除的字数目)、错字(用S示意,即需要替换的字数目)。
将AirText与俩基线行动(IMU-CNN和BLSTM)比拟,最终AirText得分最低,也等于准确性最高。
三者平平分分袂为3.9%、30.9%和57.1%。
以上是单用户在单开导上的测评成果。
为了更准确,他们还测试了多用户和多开导,成果如下:
左图中,团结个用户使用5种不同智高人表测试AirText得回的准确率得分分袂为:8.3%、7.5%、6.5%、7.7%和3.9%。
谈判人员示意,7%的WER意味着平均每15个单词中有一个识别特别,这关于隔白手写来说也曾可以收受的。
右图中,8位不同用户使用团结腕表得回了11.2%、5.9%、4.3%、4.0%、3.6%、5.9%、4.7%和3.9%的WER。
从中咱们可以看出,与不同的开导比拟,不同的用户瞄准确性的影响更大。
不外谈判人员示意,借助模子更新组件,AirTex 仍然可以针对不同用户已毕较高的准确率。
然后是速率测试。
由于BLSTM基线的WER约为57%,特别率太高,谈判人员只比较了AirText和IMU-CNN两者的速率。
讨论筹商是WPM(单词/每分钟,Word Per Minute),其野心样式为用总体输入字数-特别字数/技艺。
成果AirText的平均WPM为8.1,而IMU-CNN基线的WPM仅为4.6。
谈判人员指出,此输入速率与一些基于双手触摸屏的文本输入行动绝顶(这些行动在本色诈欺中的WPM为9.1、9.8WPM)。
总体来看,AirText的准确率可以,但速率还需要越过。
慢的主要原因也曾因为它每拼写一个字符就需停顿一忽儿。
谈判人员正在谈判破解方针,并示意最终有好奇钦慕好奇钦慕将AirText营业化。
作家先容
一看成浙江大学野心计学院助理教悔高艺,浙江大学博士毕业,谈判场所包括镶嵌式软件、无线和挪动野心、传感器蕴蓄和信息物理系统。
通信作家为浙大野心计学院副教悔、博导董玮,一样为浙大博士毕业,谈判场所包括物联网系统和蕴蓄、边际野心、无线和挪动野心。
其谷歌学术援用次数认为3000+。
论文地址:
https://ieeexplore.ieee.org/document/9625777

|