第二十八章 前期打算-《硬核危机》
第(2/3)页
按照常理来说,一个开发者构建一个高质量的app,包括前端的设计、用户界面的布置、后端的整合及身份管理、身份验证、缓存等等,由功能完整到上架应用市场,大致需要10周到30周的时间,取决于开发团队的技术水准和大小。
这是一个团队要用的时间!
单独一人,想要完成高质量复杂的app,花个一两年都很正常。
何况陆渊想做的还是个语音助手类的智能app,这就更为恐怖了,现如今移动端市场上,语音助手无非就两个占据天下,一个是苹果,一个是微软,其余的语音助手在技术上都无法与之相提并论。
这在于语音助手不同于普通app,已经初步涉及到了人工智能,不要说太过复杂,单单一个语音采样后的语音处理,就是一个大坑,难倒了不知多少大公司。
如何解决复杂环境下的采样,如何搞定人声的精准识别,这是个人语音助理的难题,也是最基础的部分,搞定不了这个,后面的各项功能也无从谈起,连人的声音都不能准确识别,还怎么让程序去处理分析问题?
不过以上困难,仅针对于常人。
有了nzt-48,陆渊的工作效率将达到常态十倍到二十倍的速度,这不止是在于他手脚快速,还在于他的大脑能一心十用,像计算机那样并行处理各类的问题,加上桑尼最为重要的协助,他就能把这个时间缩减到一个月内搞定。
交谈、研究、睡觉,等到第二天一大早,先锻炼了两个小时,紧接着陆渊则赶回市区,再次重复着手于《机械公敌》内的事情,一边监视屏幕内主角戴尔的动向,一边在另外台电脑上工作。
既然决定要推出一个app来打开市场,那么这个语音助手就必须要有特点才行……不,是必须要做到能打败市场上所有语音助手的层次,否则别人怎么会用你。
服用了nzt以后,陆渊大脑思维活跃,许多以前难以想到的点子迅速用了出来,几大技术模块的设想与规划设想,一一在电脑上被敲打出来。
要是他以前有着这等的思维學习能力,何愁在一家小小的公司当职员,随便做点什么也早已成功。
“采样的频率设定不能太大了,不然噪音太多,干扰太强……”
语音识别将利用手机的麦克风对周围进行声音采用,如果设定的采样频率太大,势必记录许多不相干和没用的噪音,所以采样的频率设定也很重要。
陆渊主要先做中文的识别,人类的语言分音节,音节之间都有停顿,在输入的数据中舍去频率低于一定值的部分,余下的段落对应各个字。
但是舍去的标准是个难题,人类说话有高有低,标准不好设定。
在这里陆渊干脆采取波形,不论声调的高低,总是有形状的,先采取几个完整的声音波形,算出其中的平均频率,取这中间的几分之一作为标准即可。只是舍去一部分之后,剩余的部分可能会不太完整,由于环境中采样的声音肯定会有噪音存在,该舍弃的结果没舍弃,这就有了问题。
第(2/3)页