中金在线 > 行业 > 行业综合

|行业综合

Rokid 公布全栈语音解决方案:边缘人和他怀中的尖刀

中国网 佚名

|
  

  昨天,阿里巴巴在云栖大会上宣布成立达摩院之后,Rokid 的公众号发布了一篇文章,题目是「达摩院外的边缘人」,作者在文章中说,「我们坚信未来改变世界的,是那些聚光灯之外的边缘人。」
  今天,在 AliGenie 开放平台发布会之前,Rokid 的 CEO 祝铭明(Misa)在阿里云 IoT 分会场公布了 Rokid 自己的全栈语音解决方案(turn key solution),开始了面向语音和智能行业的全面技术开放。
  当 Rokid 的姊妹花 Alien + Pebble 秀了肌肉并赢得了赞美后,Rokid 在硬件、AI 能力、以及内容和服务上,想怎样开放?
  在 AliGenie 正式发布之后,BAT 巨头们在语音智能领域的平台布局算是全部展露了完整面貌。对语音智能产品厂商和开发者来说,各个平台开放相关技术方案时的软硬件「标配」已经非常熟悉。同样,Rokid 全栈语音解决方案也提供了包括硬件、软件技术和内容服务以及参考设计在内的全套产品支持体系。
  

  Rokid 的开发板
  硬件上,Rokid 做了一块十分漂亮的开发板,搭载了包括麦克风阵列、CPU、GPU 和信号处理在内完整硬件配置,并配备了 3.5mm 音频接口、Micro HDMI、Type-C 等丰富接口,可分别搭载 Linux 和 Android 操作系统,并可根据需要选择阿里云或 Rokid 的语音服务,开发者和合作伙伴能够免费同时共享两方的语音技能。
  这个开发板几乎等于把若琪产品的硬件内核直接抠了出来,接个音箱就能实现与 Rokid 自家产品同等的智能语音效果。
  

  提供更加丰富开发能力的扩展板
  语音和语义上,Rokid 开放的技术包括语音识别、信号分析处理、语音合成、语义理解、自定义唤醒词、声纹识别、个性化语音合成、语种识别、自定义对话引擎等等。
  昨天在 Rokid 办公室,笔者体验了Rokid 自定义唤醒词的实际效果,在 Rokid 用户手机端直接输入任意唤醒词(目前要求三个或三个以上汉字)之后,无需任何训练就可以立刻使用自定义唤醒词来唤醒Rokid Pebble,在特意尝试了气音、叠字等有些刁难意味的唤醒词之后,Rokid Pebble 都能够成功被唤醒。
加载全文

全部评论 登录 可发布评论哦!
加载更多

[an error occurred while processing this directive]