返回

137 语音识别数据库

首页
关灯
护眼
字:
上一页 回目录 下一页 进书架
没来得及查是吧?”李景然看着此时显得极度紧张的江小柔道,脸上还是笑眯眯的。

    但他这种笑容,却给才上班不久的江小柔,带来的巨大的压力。

    “对不起,李总,我――”江小柔神色焦急,以为李景然要责怪自己。

    “没关系,小柔。不懂的可以慢慢学。没有人天生下来就懂的。你过来,我已经找到了几个免费的语音库,我把网址发给你,你把它们全部下载下来,然后再用u盘拷贝给我,好吧?”李景然把忐忑不安,有些不知所措的江小柔叫到自己的身边,给她看了看自己找的语音库,然后又说,“好了,先出去吧,我马上就把网址发给你。”

    “嗯,李总,我一定马上去办!”江小柔重重的点了点头。她原以为李景然会责怪自己办事不力,但李景然不仅没有责怪她,反而帮她做了一些本该她自己做的工作,这让江小柔在松了一口气的同时又有些愧疚。江小柔用力的吸了口气,捏了捏小拳头,在心中对自己道:

    江小柔,你一定要努力呀!

    对于网上的那几家语音库供应商,综合比较之后,李景然就对深圳的一家名叫智冠语音数据中心的语音库供应商感兴趣起来。

    “不错嘛,……从2004年就开始从事专业的语音数据采集……在全中国有超过20个数据采集中心……可以根据用户的需求,收集各种语音,甚至包括方言……和大陆,包括香港的多家高校,研究所,公司都有着紧密的合作关系,甚至和全球最大的数据中心ldc也有合作……不错不错,就是这家了!”李景然在网上翻看着这家数据供应商的介绍,是越看越感兴趣,越看越兴奋。

    通过这两天的扫盲,李景然明白,语音数据库的采集和整理就如同编撰字典一样,绝对是一件浩繁的大工程!实际上,在某种意义上说,建立语音数据库就是编撰字典――编撰声音的字典!它需要收集每个字词的不同发音,然后进行标注,检查,整理,分离,然后合成一部声音的大字典!

    但这比起编撰字典来说,复杂程度和工程量又要浩大得多。因为每个字词的写法只有一种,但它们的发音却有可能有多种,男人是一种声,女人又是一种声,如果用不同的方言来讲,更是不同,而且所有的这些音,都需要专业的采集设备来采集。因此,建立语音数据库,绝不是像李景然当初那样简简单单的买些字典,收集些文本资料就可以搞定的事情。

    在不能向真智开放互联网,让他这个超级智能到互联网上去自主采集的前提下,要想得到一个比较满意的数据库,那绝对是一件需要集众人之所长才能完成的壮举!

    与深圳智冠的联系相当简单,当李景然在电话中报了自己的来历,并向对方说明自己想购买专业的语音数据库后,那边的人立即表示出了极大的兴趣。

    “雷山生,我们有各种不同类型的专业语音数据库,涵盖了普通话,粤语,大陆各地方言以及英语的数据库,请问你系准备购买哪种类型的数据库噶?”一个明显带着粤语普通话的中年男音在电话中对着李景然道。

    “雷山生?”李景然一愣,“妈的,老子姓李

    (本章未完,请点击下一页继续阅读)
上一页 回目录 下一页 存书签