最新出炉的殷某桢诉北京某智能科技公司等人格权纠纷案(人民法院案例库入库编号2025-07-2-474-001)就是典型的AI配音侵犯声音权案件。
该案原告殷某桢是配音演员,殷某桢偶然中发现北京某智能科技有限公司开发了一款文本转语音App,该App利用AI大语言模型,可以把用户输入的文本内容转换为语音,并可以选择不同的音色,而配音演员殷某桢的声音就是可选音色之一。

后来法院查明,被告软件公司曾经以殷某桢录制的一段录音作品为素材,采用人工智能等技术对素材进行处理,并生成了涉案的文本转语音产品。
北京互联网法院认为,对于人工智能技术处理后的声音,一般社会公众或者一定范围内的公众根据音色、语调和发音风格,能够识别出特定自然人的,则该声音属于自然人声音权益的保护范围,未经自然人许可使用经人工智能技术处理的声音,构成对自然人声音权益的侵权。
具体而言,怎么能够确定“一般民众或者一定范围内的公众根据音色、语调和发音风格能够识别出的特定声音呢?北京互联网法院在该入库案例中指出:他人(如随机的一般民众或者一定范围内的公众),在反复多次或者长期聆听的基础上,能够通过该声音识别出特定的自然人,那么自然人的该种声音就具有可识别性。通过AI人工合成的声音,如果能够通过上述过程关联到某自然人,那么该AI人工合成的声音就可以被认定为是该自然人的具有可识别性的声音。反之则没有可识别性,不受保护。
简言之,该典型案例明确了受到保护的自然人声音,一定是有可识别性的声音。应当足以识别到特定的自然人,具有明显的特征指向性。如果某个自然人的声音没有明确的特征指向性。一般社会民众或者一定范围内的公众无法识别该声音,无法将该声音对应到某个自然人,则该声音就因为没有可识别性而不受保护。
另外,单纯模仿他人的声音,比如某些视频网站和短视频App上的各类模仿秀,不宜认定构成声音侵权。