分类
信息技术

讯飞语音输入:思想有多快,输入有多快

最近安装了一款iPhone应用:讯飞语音输入(讯飞输入法将内置到iPhone手机下个版本的iOS 8系统中,安卓系统应该早就有了),直接对着手机说话就可以将语音变成文字,支持英语、普通话还有各地的方言(河南话、东北话、四川话、天津话、山东话、湖南话、武汉话、合肥话、粤语广东话等)。我的普通话水平一般,亲自测试发现也有非常不错的识别率和流畅度,应用的表现令我很惊讶,不愧为中科大研发的技术。

语音输入生成的文字直接复制粘贴到其它地方——发微博、微信应该更方便了,还支持通过短信、邮件发送,也支持将输入的内容发送到Twitter和Facebook,很方便。我打算把它作为平时的记录本儿,随时随地记录自己的思想片断(不足之处:因语音识别基于云计算,需要联网),只要对着手机说一下,想法就直接变成了文字,高效快捷——如果你愿意,你也可以用它来写博客。

说起文字输入输出,最初我们是通过双手一个个字写在纸上,输出记录我们的思想,这不容易,如果要修改,就非常麻烦。后来,我们有了电脑,文字输入变成了电子版,解决了便于修改、传播、存储和搜索的等问题,但一个字一个字在键盘上输入依然不方便,尤其是中文用户还受制于输入法,是用五笔还是用拼音?都没有完美的方案。

想起了我曾经努力学五笔输入法,现在总算可以通过语音就完成一定的输入输出,只要对着输入设备说话:所有的内容就变成了文字,变成可搜索的内容。从这一点来讲,科技的进步的确是解放人类。

我曾经觉得声音语音输入是多么遥远的事情,没想到科技进步正在慢慢地实现了语音输入,这个时代已经来了。只不过我们的使用习惯,还有待时间慢慢去适应。比如,我目前还是喜欢通过键盘去进行较深入内容的输入输出。当然,技术在变,技术的使用者也要跟着变,只要变得不是太快,总还是能赶上的。

我猜测将来可以直接通过大脑中的意识流输入输出,你在想什么,电脑端的文字就出现什么,实现思想有多快,打字就有多快。不过,这样也有一个问题,正如我曾经在一篇博文中所说:男人除了性还想些什么?如果我们脑子里想些什么,文字就输出什么,那我们将看到是些什么东西呢?当然这是题外话。

有一点是确定的,互联网上电脑端的文字输入将越来越容易,而最重要的东西:思想,未必会越容易输出,它需要一颗智慧的大脑,电脑只是工具的一种形式。

“讯飞语音输入:思想有多快,输入有多快”上的41条回复

如果不出意外的话,QQ用的就是讯飞的技术,微信里面有讯飞语音插件,如果腾讯有了相应的技术,不可能还要讯飞插手。好像讯飞的语音识别技术是业内最高的,可能比Google的还要好——就中文这一块。

刚查了一下,好像QQ有自己的语音识别技术,但很一般。

除五笔字型外的输入法对于我来说都不好意,对于我这种广州式普通话,再好的语音输入法都是个笑话。

就像当年的拼音也不好用,后来可以智能拼音,再个性化的词组。语音识别肯定也会变得个性化,让机器训练学习适应你的语料库就可以了——这只是一个思路,具体还要技术上的跟进。

一年前手机越狱,装的百度输入法,也带语音输入,基本上也一字不落的。当然,那时候只试了汉语普通话。
这玩意儿需要网络畅通吧?我会告诉你我还在4G网络时代用着2G的服务么…

看来我后知后觉了。这语音识别引擎估计弄到本地不联网有难度,所以目前估计都需要连上强大的云端处理器。

汗,这么大的数据量,即使是这样,估计也不够用,还是用云端的处理方案比较省事——但就需要时刻联网。

现在的虚拟现实技术发展也是不错的。
意识控制我见过好几回报道了,理论和实践上估计都没有问题,只看如何运用得流畅。

坛子,听说过温州话嘛…想到什么文字就输出什么的还不是最行的,更行的是想到什么类似于屏幕的东西就输出图片、动画…

真有这个东东?想试一下。
这个语音输入技术太妙了,普通话说的不准的老外,打出来的内容会是怎样的?结论是:一定要学好普通话口语!

早知道了。还有百度输入法也支持语音输入,

二者识别率都不错

但想流畅输入(像打字这样)还是有差距的,而且习惯难改,要联网

我的确算后知后觉了。
用户习惯的问题也是需要改的,不过,我倒是习惯了用键盘来敲打去写点东西,直接说下来,还是需要做很大的改动——毕竟脑子思考东西还是需要时间的。

我想起了一个故事,有人做了一个名牌扫描的软件,扫描上去识别的效率非常高,而普通的软件开发人员如何改进都达不到这么高的识别率,后来,人家说了,我们是扫描后台全人工转换,你说能不高吗?而这些人工费还不贵。

我也在iPad上安装过讯飞,也用过Mac OS X的听写功能,感觉效果都还可以。尤其是讯飞,识别率真高。

我也尝试过几篇博客先用OS X的听写功能语音录入,然后修改完成。蛮有意思。

回复 土木坛子 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注