热点科技

标题: 搜狗AI录音笔E1评测:语音转写文字,加点难度才叫王者 [打印本页]

作者: 摆摆鱼    时间: 2020-6-17 23:04
标题: 搜狗AI录音笔E1评测:语音转写文字,加点难度才叫王者


我最近在各大直播间、推送室看到了一款名为搜狗AI录音的产品,一系列褒奖吹得称神,录音高质、转写精准、多语言转写、还能多专业领域词转写……不得不说搜狗的宣传工作做得相当实在。我由于工作需要,抱着试试看、不行就退货的想法近期也入手了一款搜狗AI录音笔E1,看看它到底是否如网上说的那么神乎其神,啥都能录能转?今天就跟大家实际分享一下近期对这款产品的使用体验。
搜狗AI录音笔E1是一款什么样的产品?


外观上看,搜狗AI录音笔E1的造型就像原来的直板手机一样,机身中间有一块1.54英寸的小巧显示屏,在屏幕内可以实时查看录音、转写信息,屏幕本身也支持触控操作。


屏幕下方有三个按键:录音开始/暂停、停止按键和多功能M键,使用操作起来还是很简单的,没有复杂的功能操作;尤其是暂停按键在一些特殊场合能够进行选择性录音。


机身顶部有2颗哈曼指向麦克风,看着有点专业的样子;此外机身上面还有6颗全向麦克风,拾音效果不错。加上8麦阵列算法、降噪算法以及AGC自动增益技术等,E1能够过滤多种噪音,降噪效果明显。当然这些各种算法都是官方的宣传,具体的使用效果还得实际测试。
搜狗AI录音笔E1有什么功能?


通过上面的简单介绍大家应该对这款产品有了初步了解,简单概括来说搜狗AI录音笔的功能有两个:录音转写文字、翻译功能。


先来说翻译功能包括两部分,其中一个是对话翻译,录音笔支持63种语言互译,覆盖200多个国家和地区,对于一些外企工作的员工或者出国旅行的场景来说都能派上用场。简单的测试了一下,录音笔在翻译的语句,在词汇准确度、语气助词、语法方面都要比手机软件翻译的结果好很多。


另一个翻译功能就是同声传译,它能随时帮助我们处理需要中英互译的场景,通过一段英中测试,可以看到实时翻译转化成中文速度很快,并且其中没有明显的单词错误,语法也基本正确。


对于我自身来说,最需要用到的还是录音转写文字功能;因为我的公司经常会举办各种培训、召开会议,平时也需要外出拜访客户;即便再好的脑子,再快的手写速度也很难将全部的会议记录或者客户对话信息记录下来。整理报告的时候又会花费相当长的时间,这也是入手这款产品的一个主要原因。另外,由于我公司的产品特殊,一些医疗法律上的专业名词会常常挂在嘴边,E1另一个吸引我的原因就是它独具的“专业领域”词汇识别。
专业性能测试


录音笔的文字转写能力主要体现在两个方面,一个是转写速度,另一个是转写准确度。可能很多品牌的录音笔在一些普通话、常用词汇的转写上都能做到较高的准确率,但像我刚才提到的工作中遇到的专业性词汇应该如何处理呢?搜狗AI录音笔E1宣称可以识别文化体育、财经贸易、IT科技类、政法、医疗5类专业领域的行业术语,录音转写准确率达到了98%。下面实际测试一下。
文化体育


文化部分选取了一段鲁迅先生的散文《孔乙己》,通过和原文对比可以看到转写错误的地方是把“时长夹些”转写成了“市场加血”,再有就是很多应该用逗号断句的地方没有断句;整段文字140多个文字错了转写错了4个字,准确率达到了97%。
IT科技


节选了一段人工智能相关的文章进行录音转写,转写后对比可以看到只有“及”转写成了“即”,其他还是标点符号的错误,很多顿号、逗号都没有转写出来。其实我在读这段话的时候都很绕嘴的,里面的科技类的词汇很多没有碰到过,但是搜狗AI录音笔E1的转写非常及时也很准确。
财经贸易


经济类的转写前后对比发现竟然没有一个文字错误,也只是一些标点符号和断句的错误。
医疗


下面到了我最常碰到的医疗相关测试对比。可以看到,原文非常的晦涩,多个非常专业的医疗专业词汇出现,让我惊讶的是,搜狗E1的词汇部分依然没有出现转写错误。
另一个需要高亮的地方是,我在发音“急性呼吸窘迫综合征”里面的“征”时,录音的时候说不小心说成了症(zheng是四声),结果E1的转写竟然忽略了我的发音错误,直接转写成了正确的表达法,大家可以看到上图,唯一的只出现了标点符号错误。
政法类


再看法律词汇的转写,对照原文大家可以看到只是出现了一个词汇错误,“由被动式”转写成了“有被重视”。这个在我回放的过程中,发现与我的发音有关,错把“被动式”说成了“被重视”,虽然这个是我的问题,不过也给搜狗的产品经理提一个小小建议,之后搜狗不仅仅可以语音转文字识别、还能连接一下上下文,更加智能一点。
通过这5大测试,整体上看,搜狗AI录音笔E1在专业词汇的转写方面确率确实比较高,出现的问题基本上是在断句和标点符号上面,希望后续能够进行升级改进。客观来说,E1在专业领域这块的测试结果我算是比较满意。


此外,在使用时我发现E1录音笔还具有智能整理的功能,在这里你可以选择自动区分讲话人、识别掌声笑声、隐藏空录音以及过滤语气词、停顿词、优化关键词等。用户还能在录音笔、手机APP、网页、PC客户端等多端自动同步和管理录音数据,并实现一键上传云空间、扫码分享等操作。


搜狗AI录音笔E1除了对上面提到的专业领域行业术语准确转写之外,还支持中英日韩德等10种语言、川粤津陕贵等10种方言的多语种录音和转写。对于一些普通话说的不标准,或者有多语种转写需求的人士来说,应用起来比较灵活。


笔者是天津人,都知道天津是哏(gen)儿都,天津话听起来也比较有意思,下面就简单的用一小段天津话进行测试。


大家看一下测试结果,可以看到文字转写部分基本都准确,尤其对一些标志性方言词汇转写的很到位。不过跟之前的专业领域相比,整段对话中同时出现了两处标点和断句错误。
其它介绍


在使用上,搜狗AI录音笔E1还设计了一些不错的小体验,比如说在录音的过程中可以实时通过多功能M按键进行内容标记,后面转写成文字之后可以有针对性的进行快速查找,提高工作效率,这个功能在我开会记录的时候特别好用。




录音场景方面,搜狗AI录音笔E1共拥有2种降噪方式:真实音质、人声增强;4种录音模式:会议、听课、采访、以及音乐。使用的时候可以在不同环境下选择合适的降噪方式,例如:在课堂或会议上录音时,可以选择人声增强,从而获得更好的录音效果。


最后再和大家简单说一下搜狗AI录音笔E1的转写速度和降噪效果——
转写速度:官方给出的数据是1小时的录音,只需要5分钟就能出稿,转写时长仅为录音时长 1/12。通过实际的测试,确实能够达到这样的转写速度,基本上10分钟的录音,短短的几秒钟就能够转写完了。
降噪效果:前面提到过官方给出的各种技术参数,实际通过户外嘈杂环境测试、多人会议室以及室内回声较强环境的多种测试,录音笔都能准确的进行拾音,降噪效果不错。


总的来说,通过我的实际使用来看,搜狗AI录音笔E1的综合体验还是很不错的,尤其是对专业领域的转写准确率很高,很符合像我专业属性较强的办公人员使用。如果你对这款产品有兴趣,可以趁着618关注一下。你对这款录音笔怎么看?欢迎留言。






欢迎光临 热点科技 (https://itheat.com/activity/) Powered by Discuz! X3.2