AIGC产业研究报告 2023——音频生成篇
今年以来,随着人工智能技术不断实现突破迭代,生成式AI的话题多次成为热门,而人工智能内容生成(AIGC)的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势,易观对AIGC产业进行了探索并将发布AIGC产业研究报告系列。 报告以内容生成模态作为视角,涵盖了AIGC在语言生成、图像生成、音频生成、视频生成、三维生成、分子发现与电路设计(图生成)等领域的技术发展、关键能力、典型应用场景,我国AIGC产业在商业化落地过程所面临的挑战和对前景的展望。希望通过梳理和把握AIGC产业的发展脉络,为各领域的应用开发者和使用者提供参考。 在本期音频生成篇中,报告从音频技术的发展历程展开,回顾了拼接合成、参数合成、端到端合成三个关键阶段,分析了生成速度、语音质量、控制能力等模型关键能力的应用表现、国内外市场上的主流产品,以及在进行商业化落地时,来自数据、性能、需求三方面的挑战和解决思路。