名偵探柯南是眾多人心中崇拜的偶像,沒有案子能難倒柯南,
不過,柯南辦案離不開高科技“武器”,其中最讓人夢寐以求的一種“武器”就是蝴蝶結變聲器,因為它隨心所欲地克隆任何人的聲音,
其實,在現實世界中,這樣的變聲器并不少見。網上搜索“變聲器”,便跳出各種軟體,“帥哥變蘿莉,大媽變御姐”,任君選擇。
百度變聲器搜索頁面
在某些領域,變聲技術也成了企業業務中的重要支撐。比如高德地圖里林志玲、周星馳的導航聲音,就得到了很多人的支持,
那“變聲”是怎么實現的呢?
“變聲”變的是什么?
首先,我們先得了解聲音具有哪些性質。判斷兩個聲音是否相同,我們一般從音調,響度,音色三個方面進行比較,
音調強調聲音的高低,響度反應聲音能傳播的距離,音色是一聲音特有波形的外在表現,結合這3個因素,就能分辨出不同的聲音,
圖片來源:《名偵探柯南》
要想實現“變聲”,就要從這三個因素下手,通常來講,變聲器借助對音色和音調的雙重復合改變,實現對聲音的改變。
變聲器之所以能變聲是因為建立了一套獨特的算法,能識別聲音的音色和音調并對其進行調整,讓聲音產生變化,
變聲器app截圖,可選擇不同的聲音進行變聲圖片來源于網路
變聲器類型
目前市場上的變聲器主要有兩大類,一類是硬件變聲器,一類是軟體變聲器,雖然表現形式不一,但是變聲原理相似。
硬件變聲器是通過各種聲卡(也就是硬件聲卡)變聲,聲卡里預置了各種設置好算法的聲音,借此實現“變聲”。但這種方式缺點很明顯,那就是電流聲明顯且種類相對較少,
相比之下,軟體變聲器使用更方便,能滿足各種變聲需求(比如唱歌,播音主持等),使聲音更加立體,音效也更為豐富,
怎么實現變聲
那這些不同的變聲器到底是怎么改變聲音特質的呢?
01 聲波采樣和時域分析
人發聲的本質是通過聲帶震動,帶動空氣產生氣壓差,從而讓聲波在空氣中傳播。變聲器要在一定范圍內采集量化這些聲音,通常采樣在44100Hz,量化的范圍在16bit,)也就是說,在一秒內可采樣44100個樣本點來描繪波形。
這些波形里面有各種不同的小波形,學術上叫做“基波”,每個人的基波不一樣,都有自己的基音周期,也就是“基音頻率”,即個體所擁有的獨特的音頻/音質/音色/音調,從而建立起各種各樣聲音的“資料庫”。
圖片來源:科學探索中心
02 傅里葉轉換
對聲音進行了采樣和量化,接下來就是傅里葉轉換,只有轉換成頻譜圖,然后通過各種算法去捕捉規律,對聲音信號以及不同聲音頻率的識別和分析,從而達到變聲,
傅里葉轉換小科普:傅里葉轉換是由傅里葉數學家所發明,要想完整的從數學角度了解傅里葉轉換必須具有高等數學的基礎,不過從通俗易懂的角度去理解,傅里葉轉換就是指將一件事情從兩個維度去分析,比如一首歌,不同的時間段有不同的音調,但是從另一方面分析,可以把每個時間段的音調轉換成數字,從而精準定位不同時間段的不同“調調”。
03 賦予音色風格
變聲器不僅要能識別音頻和語言內容,還要能賦予音色不同風格(比如語速快慢、強弱),只有這樣,變聲才稱得上是隨心所欲,