LanternD +

麦克风和语音输入法的测试

语音输入的成本

 之前有一段时间没有网购了,最近不小心打开了亚马逊,刚好看到有麦克风的推荐,也是突发奇想买一个。于是我开始搜索,后来发现了一个$40左右的麦克风,还配有防震架,在和一个支架配合固定到桌子上以后,能够实现一个相对稳定而且看起来比较专业的录音环境。

Final

(一不小心暴露工作环境了,咳咳。希望没有泄露什么信息)

 但是买回来之后发现是电容式的麦克风。说明书里面写到还需要买一个Phantom Power,使输出更稳定更靠谱。实际测试中也发现声音偏小,如果把机内的录音增益调到+30dB的话会出现一些噪音,也就是说只能在+20dB以下的增益工作。于是又到亚马逊拍了一个幻象电源,最后全部东西加起来总共花费$88左右。想想也蛮贵的,毕竟只有一个录音的功能,并且所有东西均为Made in China。而我的使用范围如上一段所述,并不是很广,希望以后继续扩展更多的使用途径。

 实际上所有东西就绪以后,我也对麦克风进行了一些测试。我在录音软件Audition CS6中录制声音波形的时候发现,当我没有说话的时候,录到的波形完全为零。这令我非常满意,说明其抗噪水平还是不错的。往常使用的录音设备无一不将背景的噪音、空气流动的声音录了下来,回放的时候有不舒服的感觉。

关于讯飞

初步使用

 麦克风最直接的用法就是能够实现语音输入。麦克风没到货之前我就在网上搜了一圈,然后发现了一个叫做讯飞的语音输入法,好评率很高,听说识别率还不错,于是就下载了。现在这篇文章实际上就是用这个输入法进行语音输入、生成的。理论上如果普通话好,同时吐字比较清晰,识别效果还是非常令人满意的,现在对着文档编辑环境,说一句话能够在屏幕上出现一句话,不得不说输入的效率还是能比打字高一些的,尤其是思路清晰说出的句子比较长的时候。事实上,说的字数越少,识别的难度越高。这点和我们平时说话交流的时候是一样的道理,大家主要都靠词组来推断、补充完整句子信息。

 但现在在使用的初期,个人感觉这特别别扭,把脑子里想的内容说出来有一种诡异的感觉。恍惚之间仿佛自己在做演讲,而博客的看客也变成了听众。姑且也当进行了演讲训练了。

 众所周知在手机上也有语音输入法,但是我们平时都很少用,因为打字的方式在公共场合能够更好的保护我们的隐私。而我们一天中大部分的时间一般都会处在公众场合之中。那些在公众场合养成的习惯并不容易改正,或者说改变,所以我(们)其实在私下的场合也经常是用打字的方式,只是偶尔使用语音留言的方式,语音输入基本就没用过,因为识别出来不是想要的文本的话修改的成本太高,导致效率低下。那么在电脑上用语音的输入方式和手机一个道理,我们通常都更习惯用键盘来敲出我们想说的话,突然做出这么一个改变其实还需要一段的时间,相信以后熟练以后能够比较快地输入,现在仍处于说完一段话后脑子空白一段时间,才想出下一段话接着输入的状态。

发现的一些缺点

 实际使用中我也发现了讯飞输入法的一些缺点,比如不能同时说中文和英文,即不能在中文中夹杂英文,除非在系统设置中修改。但同时讯飞并没有提供其相应切换的快捷键。所以只能在中文语言输入结束之后,手动将英文补上。

 其次,这个输入法对网络的依赖比较强,当网络不佳时,识别的时间会稍长有时甚至无法识别。据说在官网上能够下到离线的语音识别包,但是,我并没有尝试,所以无法作出评价。

 另一个关心的问题是隐私,我不知道讯飞是否会把每一段录入的文字都存起来,那得暴露多少东西啊。要是我房间里有什么不和谐的声音的话说不定也被录下来啦,咳咳。其实也还行,我用语音输入法输入的都是大段的文字,用于在博客上发表,也就是说录下来的声音都能在网上找到更全更准确的文本。只要它不在我没使用它的时候也录音就行了。

 实际上大家也都知道,「正常情况」下,语音输入的内容其实是没法使用的,不能用来发表。所以必须在文章写完之后进行人为的修订,我在后边附上了原文,仅供参考。这样一来,使用输入法的熟练程度及语音识别的精准度很大程度上决定了输入的总体效率。如果花了大量时间在纠错上也是得不偿失的。到目前为止感觉还好。

 讯飞输入法每当句子里短暂停顿和句末停顿超过2秒(可以自己修改)的时候,系统就会自动补充逗号,所以这里的非逗号标点都是我后来修改的。大家可以看看原文,什么是真正的一逗到底。

感慨一下

 想当年,到前往大学之前,我一直自认为普通话还可以,结果大一上学的时候,即使用我自认为非常标准的普通话,在周围同学眼中也属于比较奇怪的存在,一听肯定不是北方人,甚至也没到「标准」的程度。在东北呆了四年之后,现在说的普通话,既不出东北口音也听不出南方口音,我也不知道该高兴还是该难过,只知道目前普通话的标准程度能够达到语音输入的要求。我在口音上的模仿能力比较差,在适应了一种新的语言以后就改不回原来的样子了,想象也有点邯郸学步的意思,当然,我会挑靠谱的去借鉴的。好在我的家乡话和普通话完全是两个世界,所以我还没忘记家乡话怎么说。

 最后希望我能够早日适应语音输入的节奏,以后打字更快,就是这样吧。

语音输入原文

 以下为语音输入原文,后期调整的时候我又输入了不少内容,让文章连贯。反正有兴趣就对比一下看看是什么效果吧:


之前有一段时间没有网购东西,打开了亚马逊,刚好看到有麦克风的推荐,也是突发奇想买一个,于是开始搜索,后来发现了一个,三十美元左右的,麦克风,还配有防震架,在和一个支架两道固定到桌子上以后,能够实现,一个相对稳定而且看起来比较专业的录音环境,

但是买回来,之后发现是电容式的麦克风,看着说明书里面写到还需要买一个配套的,电源,于是又上网电来,一个,于是又到亚马逊拍了一个,最后总共花费三十五十刀左右,想想也蛮贵的,毕竟只有一个录音的功能,而我的适用范围,而我的适用范围,适用范围,使用,并不是很广,继续扩展,更多的功能,

实际上我也对麦克风进行了一些测试,我在录音软件中怒斥波形的时候发现,当,没有说话的时候,录到的波形完全为零,这令我非常满意,说明其抗噪水平还是不错的,

麦克风最直接的用法就是,能够通过语音,进行输入,麦克风没到货之前我就在网上搜了一圈,然后发现了一个叫做讯飞的,讯飞语音的输入法,好评率很高听说识别率还不错,于是就下载了,现在这篇文章实际上就是用这个输入法进行语音输入,生成的,理论上如果普通话好,同时吐字比较清晰,识别效果还是非常令人满意的,现在对着编辑器,说一句话能够在屏幕上出现一句话,不得不说输入的效率还是能力打字高一些的,但我现在在使用的初期,个人感觉特别别扭,满脑子里想的内容说出来,有一种诡异的感觉,恍惚之间,有一种在做演讲的感觉,而博客的观众也变成了听众,

众所周知在手机上也有,语音输入法,但是我们平时都很少用,因为打字的方式在公共场合能够更好的保护我们的隐私,而我们一天中大部分的时间一般都会在公众场合,你是在公众场合养成的习惯,并不容易改正,或者说改变,所以我们其实在私下的场合也经常是用打字的方式,只是偶尔使用语音留言的方式,那么在电脑上用语音的输入方式,和,手机一个道理,我们通常都用键盘来,敲出我们想说的话,做出这么一个改变其实还需要一段的时间,相信以后熟练以后能够,比较快的输入,现在仍属于,处于,说完一段话后脑子空白一段时间,才想出下一段话,接着输入,的状态,

高中毕业之前,我自认为普通话还可以,结果大一上学的时候,即使用我自认为非常标准的普通话,在别人眼中也属于,比较奇怪的存在,在东北呆了四年之后,现在说的普通话,既不出东北口音也听不出南方口音,我也不知道该高兴还是该难过,只知道目前普通话的标准程度能够达到语音输入的要求,

实际使用中我发现了讯飞输入法的一些缺点,比如不能,同时说中文和英文也不能在中文中夹杂英文,除非在系统设置中修改,同时讯飞并没有提供,其相应切换的快捷键,所以只能在中文语言输入结束之后,手动将英文补上,其实这个输入法对,网络的依赖比较强,当网络不佳时,识别的时间会稍长有时甚至无法识别,据说在官网上能够下到澧县的识别度,但是,我并没有尝试,所以无法作出评价

实际上,正常语音输入的内容其实大家都知道,是没法使用的,不能用来发表,所以必须在文章写完之后进行人为的修订,我会在后边附上,原文,仅供参考,

希望我能够早日适应,语音输入的节奏,就是这样吧!


LanternD
LanternD_Logo






订阅

RSS订阅 微信公众号

文以类聚

更多『blog』分类的文章