语音识别

Speech Studio

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法，可以访问诸如实时语音到文本、自定义语音识别模型、发...

20,488 18

AI开发微软平台语音合成语音技术

Verbatik

Verbatik是一款由人工智能驱动的文本到语音生成器，提供了一个不断增长的库，包含142种语言和口音的600多种自然声音。

18,756 8

会议记录字幕生成文字转换语音识别

Peech

Peech是一个为营销团队设计的生成式AI视频平台，允许他们快速轻松地创建高质量和吸引人的视频。它具有自动编辑过程、用于内容管理的智能库、自动生成的字幕、可定制的品牌元素、重...

17,020 20

文本转换语音识别语音转文字

wisecut

Wisecut是一款在线自动视频编辑软件，它使用人工智能和语音识别来快速轻松地编辑视频。它会自动将长视频剪辑成更短、更有影响力的内容，并配有音乐、字幕和面部识别功能。它还使用...

16,861 12

AI技术Wisecut字幕生成视频编辑

Kimi+

Kimi 是由月之暗面科技有限公司开发的人工智能助手。它具备多语言对话能力，擅长中文和英文，能够处理长文本，支持文件阅读和网址解析，具备搜索能力，并且能够结合搜索结果为用户...

16,615 14

AIKimi任务管理智能助手

讯飞星火API

讯飞星火API提供强大的语音识别与自然语言处理功能，助力开发者快速构建智能应用。

15,635 20

API智能开发自然语言处理讯飞星火

捷通华声—人工智能技术与服务提供商

捷通华声专注于提供先进的人工智能技术与服务，助力企业智能化转型与创新。

13,733 10

人工智能自然语言处理计算机视觉语音识别

思必驰 DFM-2 大模型

思必驰 DFM-2 大模型作为思必驰的自研对话式语言大模型，展现了其在多模态交互和行业应用中的潜力。它通过结合先进的AI技术，为用户提供了更加智能化和个性化的体验，推动了智能语...

11,588 8

AI技术大模型思必驰DFM-2自然语言处理

网易见外

网易见外是由网易人工智能事业部研发的AI智能语音转写听翻平台，提供视频听翻、直播听翻、语音转写、文档直翻等功能。

8,453 16

多语言翻译智能翻译网易见外语音识别

云知声山海大模型

云知声山海大模型是一个多功能、跨领域的智能大模型，它通过集成丰富的知识库和先进的自然语言处理技术，为用户提供了一个强大的信息和知识服务平台。

7,565 12

AI语音云知声智能对话自然语言处理

LipDub语音翻译

LipDub语音翻译工具提供高效的实时语音转文字服务，帮助用户轻松实现多语言沟通和内容转录。

7,369 10

多语言翻译实时转文字语音翻译语音识别

讯飞星火

讯飞星火AI助手，高性能AI语言模型，具备多模态理解和生成能力，服务于企业服务、智能硬件、智慧政务、智慧金融、智慧生活和智慧医疗等多个领域。

6,276 4

智能语音讯飞星火语音合成语音识别

百度翻译·AI同传

探索百度翻译AI同传技术的核心功能与实际应用场景，了解其如何实现高效准确的实时翻译。

6,124 20

AI同传实时翻译百度翻译语音识别

FunAudioLLM

由阿里巴巴集团通义语音团队开发的框架，旨在增强人类与大型语言模型（LLMs）之间的自然语音交互

5,077 12

FunAudioLLM机器学习语音识别音频处理

Peech

Peech 是一个强大的文本转语音工具，能够轻松地将文本转换成超过50种语言的逼真AI生成音频。

4,603 12

Peech技术应用效率提升语音识别

出门问问api

出门问问（Chumen Wenwen）是一家中国的人工智能公司，以其智能语音助手和相关技术而闻名。出门问问提供的OPEN API（开放应用程序编程接口）允许开发者将出门问问的技术集成到自己...

4,107 2

API出门问问智能交互自然语言处理

百小应

百小应是一款功能强大的智能助手，提供多种便捷服务，帮助用户高效处理日常事务。

3,878 10

智能助手百小应语音识别

讯飞星火

讯飞星火是科大讯飞推出的高性能AI语言模型，具备多模态理解和生成能力，服务于企业服务、智能硬件、智慧政务、智慧金融、智慧生活和智慧医疗等多个领域。

3,814 2

智能语音讯飞星火语音合成语音识别

FishSpeech

由 FishAudio 团队开发的开源、先进的多语言文本到语音（TTS）合成项目。它旨在通过结合大语言模型（LLM）技术，提供高质量、多语言的语音合成解决方案。

3,745 20

人工智能智能工具语音处理语音识别

Submagic

一个为商业、团队和创作者设计的AI视频编辑工具，它通过提供快速编辑、多语言字幕、高级素材和团队协作等功能

3,151 12

Submagic字幕生成字幕编辑视频制作

Open Voice OS

一个社区驱动的开源语音 AI 平台，用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

2,922 16

开源智能交互语音操作系统语音识别

音子AI

音子AI利用人工智能技术提供了一系列便捷的音频处理服务，无论是音乐制作的音轨分离，还是有声读物的文本转语音，都能满足用户的不同需求。

2,448 4

AI助手智能语音语音识别音子AI

有道数字人

有道智云引领创新，小采样数字人平台赋予虚拟形象生命有道智云依托智能化趋势与个性化需求，倾力打造的小采样数字人平台，允许用户在该平台上创造自己的虚拟形象。

1,985 14

人工智能智能助手有道数字人虚拟助手

Beepbooply

Beepbooply是一款人工智能驱动的文本转语音工具，允许用户快速轻松地生成具有逼真声音的音频内容。超过80种语言、120种口音和900种声音，用户可以自定义他们的音频，并生成几个小...

1,438 12

AI技术智能语音助手语音识别

AI工具导航网(aigc.itbaoku.com) —— 专注聚合全网AI生产力工具，覆盖写作、绘图、视频、办公、数字人等12类领域，精选1000+工具（含文心一言、Kimi、智谱清言等热门AI），每日更新，助您一键直达智能创作新时代！

友链申请免责声明广告合作关于我们

语音识别

最新文章