多语种语音数据采集

室外不同噪声环境:街道,公园,公共汽车,地铁,广场等,适合于进行多种环境的下的语音识别、发音人识别的数据采集;

平台系统

我们能提供基于电脑、平板、手机等多种设备、支持Android\Window\iOS 等多种OS系统采样率和录音通道的语音数据采集服务

(点击“语音数据转写和标注”了解语音数据转写和标注业务)

语音合成数据采集(拼接算法)等

语音合成数据采集(隐马算法)

“海天瑞声”可在全球采110多种语言(口音)的语音数据,覆盖亚洲、美洲、北非、欧洲等多70多个国家和地区,并随着对客户需求的不断满足,我们能提供的语言种类和数据采集种类还在不断的增多。

室内不同噪声环境:办公室,家庭,超市,咖啡厅,餐厅,商场等,适合于进行语音识别、发音人识别的数据采集;

语音数据采集服务种类

“海天瑞声”提供多种类型的语音数据采集服务,其中包括:

以及其他特殊麦克风和嵌入式设备、多模态语音数据采集、歌曲哼唱数据采集等

其他特殊定义环境

广播语音数据采集

车载:停车,不同时速的城市道路驾驶,高速公路驾驶等,适合于进行车载语音识别数据采集;

语音识别数据采集:

覆盖语言

汉语(大陆中文、香港中文、台湾中文、各地方言和重口音)、藏语、蒙语、维吾尔族语、西班牙语(西班牙西班牙语,墨西哥西班牙语,美国西班牙语等)、法语(加拿大法语,法国法语等)、英语(美国英语,英国英语,澳大利亚英语,中国英语,日本英语等)、阿拉伯语等110多种语言。(点击“语言覆盖”了解更多)

电话语音数据采集(手机/固话)

情感语音数据采集等

采样率和录音通道

常用的有:8K,16Bit;16K,16Bit;22K,16Bit;44K,16Bit;48K, 16Bit

情景风格

朗读、自然语音、对话语音、会议语音、情感语音、演讲语音、歌曲哼唱、多模态语音等,脚本语音,引导性语音等多种语音数据采集服务

语音合成数据采集:

“海天瑞声”具有大量可授权使用的、多语种、大规模工程化语音语料库资源,请点击“天籁数据中心-工程化语音数据库资源”查看; 或者,如果您需要适合于科研使用的语音语料库资源,请点击“天籁数据中心-科研语音数据库资源”查看;

应用领域

语音合成、语音识别、说话人识别、语音评测、情感识别、音乐检索等

桌面语音数据采集

车载语音数据采集

自由对话语音数据采集

语音数据采集服务的多种场景环境

专业录音室:录音棚,消声室,回声室等,适合于进行语音合成数据采集;