學(xué)者也追星 | 用統(tǒng)計(jì)學(xué)分析,解開披頭士歌曲的作者之謎
時(shí)間:2018-09-28 14:43 閱讀:1246 整理:市場(chǎng)調(diào)研公司
計(jì)量文體學(xué)(stylometry)是一種使用統(tǒng)計(jì)學(xué)技術(shù)來確定作者的方法,最著名的案例就是確定“大學(xué)炸彈客”的真身是泰德·卡辛斯基(Theodor Kaczynski),還發(fā)現(xiàn)莎士比亞和克里斯托弗·馬洛(Christopher Marlowe)合作完成了《亨利四世》的劇本。在文本分析的過程中,暴露“幕后主筆”的并非那些不尋常的用詞,而是最常用的詞匯——常用詞匯(如介詞)的反復(fù)出現(xiàn),標(biāo)志了一個(gè)人可能的身份。
在愛德華王子島的某次科學(xué)大會(huì)上,哈佛大學(xué)的統(tǒng)計(jì)學(xué)高級(jí)講師馬克·格利克曼(Mark Glickman)和戴爾豪斯大學(xué)的數(shù)學(xué)教授杰森·布朗(Jason Brown)意外發(fā)現(xiàn)對(duì)方也是披頭士樂隊(duì)(Beatles)的“真愛粉”,他們都想知道計(jì)量文體學(xué)的方法能否回答那個(gè)爭(zhēng)議不休的問題:這些歌到底是誰寫的,是列儂還是麥卡特尼?
格利克曼解釋說,對(duì)于大部分標(biāo)著“列儂-麥卡特尼”的歌曲,大家都清楚,也白紙黑字地寫明,這是兩人中的誰寫的歌。然而,有數(shù)量驚人的歌曲(或者歌曲中某些段落)的作者尚存爭(zhēng)議。例如,沒人知道是誰創(chuàng)作了《In my Life》,這首歌出自 1965 年的專輯《橡皮靈魂》(Rubber Soul),在《滾石》(Rolling Stone)評(píng)選的“史上最偉大的 500首 歌曲”中排名第 23 位。列儂和麥卡特尼對(duì)這首歌的記憶完全不同?!八?,我們想知道是否能夠使用數(shù)據(jù)分析技術(shù),試圖解開這首歌的創(chuàng)作之謎,看看它到底出自哪位之手?!备窭寺v道。
在哈佛統(tǒng)計(jì)學(xué)專業(yè)學(xué)生宋瑞安(音譯,Ryan Song)的幫助下,格利克曼和布朗按照五個(gè)特征維度“解構(gòu)”了披頭士從 1962 年到 1966 年的所有歌曲。每個(gè)特征維度統(tǒng)計(jì)表示歌曲中某一音樂性特征出現(xiàn)的頻率?!耙?yàn)楹茈y通過任何直接的方式將歌曲的音樂內(nèi)容量化出來,所以我們方法背后的主要思想就是將歌曲轉(zhuǎn)為一套不同的數(shù)據(jù)結(jié)構(gòu),通過定量方法給歌曲打上‘標(biāo)簽’,從而進(jìn)行檢驗(yàn)?!备窭寺^續(xù)說道,“試想一下,我們可以將某一種顏色解構(gòu)成紅、綠、藍(lán)三種顏色按一定權(quán)重的組合。我們用同樣的方法來處理披頭士的歌,當(dāng)然其中的成分不止三種??傊?,我們的方法將歌曲分解為 149 種成分。”
“歌曲的第一類特征就是不同常用和弦的使用頻率,以及不常用和弦的集合,”格利克曼解釋說,“我們確定了 11 種和弦類別?!比缓螅麄儗⑿梢舴奶卣魈崛〕鰜?,也就是主唱所唱的音符。接下來,他們記錄下和弦轉(zhuǎn)換的頻率,即一個(gè)和弦接著另一個(gè)和弦出現(xiàn)的頻率。在這里,他們?cè)俅螌⒉怀S玫暮拖肄D(zhuǎn)換歸入單獨(dú)的分類中。第四步,他們記錄連續(xù)旋律音符對(duì)出現(xiàn)的頻率。
最后,他們將歌曲分解為由四個(gè)旋律音符組成的“等高線”。格利克曼介紹,“等高線”就是四個(gè)旋音符旋律走向的排列順序,分為“上升”、“下降”和“保持不變”。換言之,如果四個(gè)音符的走向是音調(diào)逐漸上升,那么其“等高線”就是“上升-上升-上升”,即每?jī)蓚€(gè)連續(xù)音符之間的音調(diào)是上升關(guān)系。格利克曼說,通過研究四音符等高線,能夠獲得額外的細(xì)節(jié),有助于區(qū)分旋律創(chuàng)作的風(fēng)格。
在這里,格利克曼指出,這五個(gè)分類維度之所以能夠作為不同音樂創(chuàng)作風(fēng)格的“標(biāo)簽”,是因?yàn)榇蠹叶挤浅J煜づ^士的作曲風(fēng)格:列儂寫的歌通常旋律線起伏變化不大。
“想想列儂的《Help!》,它基本上是這樣,‘當(dāng)我更年輕的時(shí)候,比今天要年輕得多的時(shí)候’(When I was younger, so much younger than today),音調(diào)的變化不大。旋律會(huì)重復(fù)停留在同一個(gè)音符上,只在某些短樂句中出現(xiàn)變化。而保羅·麥卡特尼的歌,比如《Michelle》,‘蜜雪兒,我的美人,這幾個(gè)字母組合起來多么動(dòng)聽’('Michelle, ma belle. Sont les mots qui vont très bien ensemble.),這一句的音調(diào)真是迂回曲折?!?
通過音樂性特征來解決未知或者爭(zhēng)議作者問題,我們可以從以下三個(gè)步驟了解他們的方法:
首先,他們的模型假定一首歌中 149 個(gè)音樂性特征的每一個(gè)出現(xiàn)頻率都取決于歌曲作者。以“基音”(tonic,一首歌的主調(diào)和弦)為例,列儂歌曲的基音會(huì)有一定的出現(xiàn)頻率,而麥克特尼歌曲中基音出現(xiàn)頻率可能與之不同。
其次,他們使用概率論的一種常用工具“貝葉斯定理”(Bayes rule)來反轉(zhuǎn)概率。換言之,他們先統(tǒng)計(jì)作者明確的歌曲中 149 個(gè)音樂性特征的頻率,由此建立一個(gè)概率模型,再利用這 149 個(gè)特征頻率判斷一首歌的作者是列農(nóng)或麥卡特尼的概率。然后,他們使用 70 首已確定作者的列儂-麥卡特尼合作歌曲或者歌曲段落訓(xùn)練這個(gè)模型。
最后,他們用經(jīng)過訓(xùn)練的模型判斷作者有爭(zhēng)議的列儂-麥卡特尼合作歌曲或歌曲段落,預(yù)測(cè)它的作者是某個(gè)人的概率。
“所以,《In My Life》這首歌是麥卡特尼作曲的概率為 .018,也就意味著,列儂才是真正的作者?!丙溈ㄌ啬嵊涘e(cuò)了。但是《The Word》這首歌,格利克曼曾認(rèn)為它肯定是列儂作曲,但是模型預(yù)測(cè)結(jié)果告訴他作者幾乎肯定是麥卡特尼。
除了做一個(gè)音樂版《誰是真兇》(Whodunnit?,一檔娛樂節(jié)目)之外,這個(gè)模型還能有更多的用處嗎?“當(dāng)然,”格利克曼肯定道,“這個(gè)技術(shù)可以被推廣到其他地方,我們可以回顧一下流行樂發(fā)展史,把風(fēng)格流變的影響用圖表顯示出來。”

關(guān)注公眾號(hào)
獲取更多行業(yè)資訊
本站文章內(nèi)容以及所涉數(shù)據(jù)、圖片等資料來源于網(wǎng)絡(luò),轉(zhuǎn)載目的在于傳遞更多信息。版權(quán)歸作者所有,文章僅代表作者觀點(diǎn),不代表華夏經(jīng)緯立場(chǎng)。 如涉及侵權(quán),請(qǐng)聯(lián)系管理員刪除。在法律許可的范圍內(nèi),華夏經(jīng)緯(廣州)數(shù)據(jù)科技股份有限公司享有最終解釋權(quán)。
相關(guān)新聞
- 2025消毒碗柜行業(yè)市場(chǎng)運(yùn)營(yíng)格局及銷售渠道分析
- 2025年人工智能+融合市場(chǎng):行業(yè)從“單點(diǎn)突破”到“生...
- 2025年防護(hù)鞋行業(yè)現(xiàn)狀與發(fā)展趨勢(shì)分析
- 2025在線地圖服務(wù)行業(yè)市場(chǎng)未來發(fā)展趨勢(shì)預(yù)測(cè)
- 2025年壁畫行業(yè)產(chǎn)業(yè)鏈結(jié)構(gòu)及投資分析
- 2025年服裝設(shè)計(jì)行業(yè)產(chǎn)業(yè)鏈結(jié)構(gòu)及前景預(yù)測(cè)
- 2025睫毛膏行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及競(jìng)爭(zhēng)格局、供需趨勢(shì)分...
- 2025年極地機(jī)器人行業(yè)發(fā)展趨勢(shì)及產(chǎn)業(yè)鏈結(jié)構(gòu)
- 2025年智能家居產(chǎn)業(yè)鏈全景、現(xiàn)狀與未來發(fā)展趨勢(shì)
- “玩”出萬億級(jí)產(chǎn)業(yè) 戶外經(jīng)濟(jì)發(fā)展?jié)摿Υ?戶外裝備行...