2025-01-19
分享到
金融界2025年1月18日消息,國家知識產權局信息顯示,廈門她趣信息技術有限公司申請一項名為“一種語音轉化方法、裝置、設備及可讀存儲介質”的專利,公開號 CN 119314501 A,申請日期為 2024年12月。
專利摘要顯示,本發(fā)明提供了一種語音轉化方法、裝置、設備及可讀存儲介質,通過先將待轉換音頻和參考音頻通過音頻量化器進行壓縮量化,以生成待轉換音頻的語義編碼和參考音頻的參考編碼,接著,將語義編碼和參考編碼按其梅爾頻譜的長度進行對齊,以拼接成一組特征向量,調用音頻大語言模型對特征向量進行自回歸解碼生成輸出編碼,將參考音頻的梅爾頻譜輸入音色風格網絡生成感知向量,將輸出編碼和感知向量融合生成向量編碼;再接著,調用流預測網絡結合時間序列embedding和先驗分布對向量編碼進行處理,以逐步生成梅爾頻譜;最后,將梅爾頻譜通過聲碼器還原為目標語音信號,解決了現(xiàn)有的小規(guī)模的模型對細微聲音特征還原效果不夠理想的問題。
天眼查資料顯示,廈門她趣信息技術有限公司,成立于2017年,位于廈門市,是一家以從事互聯(lián)網和相關服務為主的企業(yè)。企業(yè)注冊資本1950萬人民幣。通過天眼查大數據分析,廈門她趣信息技術有限公司共對外投資了6家企業(yè),參與招投標項目13次,知識產權方面有商標信息14條,專利信息47條,此外企業(yè)還擁有行政許可12個。