QQ音樂領先科技打造品質(zhì)音樂生活,做更有溫度的音樂平臺
“生命,宇宙以及一切的終極答案是什么?”
1979年,道格拉斯·亞當斯發(fā)表了讓他日后名垂青史的科幻小說《銀河系漫游指南》。在這本小說中,他描繪了一臺名為“深思”的超級人工智能——它的使命,便是解答上面的問題。
經(jīng)過整整750萬年的運算,這臺遠超一切造物的人工智能給出了結果:“答案就是42。”
無法解釋的荒謬答案,既反映著整個宇宙不會被人賦予意義的本質(zhì),也在一定程度上代表著世人對科技的看法:人工打造的科技,可不一定具備真正的“智能”。 今年一過,這位老先生就已駕鶴西去20年,但相較于“深思”,科技正在改變著我們的日常生活體驗,甚至在某些領域,讓我們甘拜下風。
不過,今天要講的并不是人類如何再次被科技“擊敗”,而是一個有關于“欣賞”和“辨別”的故事。
緣起:科技遇見音樂
光聽“人工智能”這四個字,冷冰冰的感覺就涌上心頭。它不像你隔壁工位坐著的Steven Liu,在我們的認知中,它無法動用情感,更別提去鑒別,欣賞一幅畫,一首歌的美。
真是這樣嗎?
幾年前,身處新加坡科技設計大學從事音樂研究的一位熱愛音樂的科研工作者Dr. Simon,已經(jīng)開始思索這個問題:AI究竟能不能與音樂領域進行結合,碰撞出絢爛的火花?在研究的過程中,他也發(fā)現(xiàn)自己缺乏機遇:“沒有太多人做這個領域,而我的研究成果,也很難切實地幫助音樂人。”
在2600公里外的深圳,一群人也正在對相同的想法大搖其頭。Ben曾在偶然間發(fā)現(xiàn)“以往唱片公司通過人工聽Demo,來決定哪首歌值得推,但Demo的數(shù)量遠遠超過人工能聽的數(shù)量,導致很多歌從來沒有被聽過而被埋沒,十分可惜。”這一現(xiàn)象激發(fā)了他的思考,如果用不知疲倦的AI算法去評價歌曲,效果會怎樣?但Ben身邊的同行都不看好:“音樂是藝術,難以用科學或是算法去衡量它的質(zhì)量。”
除了選擇音樂,在Ethan眼中,通過科技讓聽者獲得更好的音樂體驗也變得越發(fā)重要:“經(jīng)過多年的技術發(fā)展,音樂技術已經(jīng)從純信號處理向AI轉變。”這就意味著,科技將是改變每一位聽眾日常聽音體驗的關鍵要素,“但在國內(nèi)音頻行業(yè)還是存在空白。”
三個人的問題其實異曲同工:如何用AI算法,鑒別、推送更為“動聽”的歌?如何借助科技,全方位讓聽者及音樂人的音樂生活變得更美好?
或許是緣分,亦或是因為心中久久揮之不去的“執(zhí)念”,念念不忘終有回響,2018年,三個人的軌跡開始串聯(lián)在了一起。當年,騰訊音樂娛樂集團CEO彭迦信去新加坡開會,遇到了雷教授,兩人互相交流了自己對音樂的見解。雷教授發(fā)現(xiàn),彭迦信的想法和自己不謀而合:“他跟我說,騰訊音樂的夢想,不只是做音樂播放器,更是要打造一個豐富、良性的音樂生態(tài),讓音樂進入生活的每個場景,讓音樂人擁有體面的收入和生活,這一點深深打動了我。”相比于教授的身份,雷教授本身也是一位音樂人,“我在大學時期,曾在餐廳做過駐場的小提琴手,深知音樂人的不易。”
面對TME拋來的橄欖枝,雷教授并沒有顧慮太多,他加入了TME,從成為QQ音樂多媒體研發(fā)中心負責人的那一刻起,如何用科技改變音樂人及億萬用戶的方方面面……太多想做的事情縈繞在他腦海,他充滿興奮和期待,甚至讓他在入職的第一天就把行李落在了出租車上。
同年,曾在王者榮耀項目上率領AI擊敗人類冠軍戰(zhàn)隊的Ben,也如約加入到團隊之中,擔任多媒體研發(fā)中心創(chuàng)新組負責人。也正是在這里,他們遇到愛朗聲說笑話的基礎開發(fā)組負責人Ethan——上文提到的三位“現(xiàn)代工匠”和他們所率領的團隊,從此將共同致力于用科技逐步改變每一位聽眾的音樂生活。
匠心:讓AI學會“聽”歌
一首歌,是怎樣送到聽眾耳邊的?
除了人工篩選,隨著流媒體平臺普及和技術進步,大家開始習慣通過播放量來選聽歌曲。“這種方式會造成鮮明的馬太效應,熱歌只會越來越熱,但0播放量的歌,可能永遠是0。”雷教授認為業(yè)界此前通用的技術,并沒有解決音樂人的難題。
想來想去,方法其實也很簡單:為AI注入溫度,讓AI學會鑒賞歌曲,利用其對海量數(shù)據(jù)的高速處理能力,輔助人工篩選,讓有才華的作品不被埋沒。
和世間的道理一樣,都是說來容易,做起來難。AI的數(shù)據(jù)處理能力,要建立在對歌曲細顆粒度“標記”上,在這個層面有兩個難題,如何對一首歌曲進行評價,維度該如何定?作為一項“藝術”,音樂的喜好沒有恒定標準,AI的篩選,是否能說服眾人?
在想法落地的過程中,Ben拉上了他的同事Moyan, 從曲風、歌詞、音色、演唱者唱腔、到后期制作與編排等,為AI制定了詳細的評判維度——QQ音樂科技團隊雖然大多出身技術,但大家都同樣愛好音樂且具備一定的專業(yè)音樂素養(yǎng)。再加上QQ音樂數(shù)以億計的海量大數(shù)據(jù),讓AI學習有了最重要的數(shù)據(jù)參考。
“當時我們都不知道要花多久,但它一定得做出來,讓優(yōu)秀但暫時沒名氣的音樂作品和音樂人不再被埋沒,就是懷著這樣的信念堅持著。”靠著過硬的技術,與對音樂的深度了解,再加上多版本的迭代和打磨,Ben的團隊推出了一項名為Predictive Model的自研技術。
通過PDM,即使是0播放量的冷啟動音樂作品,AI也能根據(jù)音頻和歌詞內(nèi)容給予充分且匹配的受眾識別與推送曝光,讓歌曲得以更高效、精準地覆蓋到適合的目標人群。換句話說,就是AI能夠辨別“欣賞”歌曲,并將符合用戶喜好的歌送到億萬樂迷耳邊。AI就相當于一位慧耳識音的“伯樂”,找到好內(nèi)容的“千里馬”,并且把“千里馬”精準地送到會喜歡它、欣賞它的人身邊。
雖然對于技術的細節(jié)不是特別了解,但資深樂迷王小毛就對PDM感觸頗深:“最近在QQ音樂上,聽到不少新歌手的新歌,而且這些歌質(zhì)量都非常高。像是此前火爆全網(wǎng)的《微微》,聽說就是由AI技術選出來的,著實讓我感嘆了一下科技的力量。”
其實在PDM落地后,已經(jīng)有數(shù)十首歌曲借其“獨具慧眼”的挖掘實現(xiàn)“爆紅”。 不僅是《微微》,《收斂》《厚顏無恥》《忘川彼岸》以及近期悄然走紅的《失控》等“國民級”歌曲,都得益于PDM技術的“鑒賞”,才步步“刷屏”全網(wǎng)。當然,億萬像王小毛一樣的樂迷,也在這個過程中發(fā)現(xiàn)了自己喜歡的更多類型的新歌。
得益于QQ音樂PDM技術的多首熱歌
除了用AI“欣賞”歌曲,科技也在Ethan團隊的手上,化為了找尋陌生好歌的“必備神器”。2013年上線的QQ音樂聽歌識曲技術,就一直以“穩(wěn)準狠”著稱。“在看一段廣告時,可能吸引我們的并不是廣告產(chǎn)品本身,而是它的配樂。又或者我們非常想要知道電影背后的歌曲是什么。”Ethan回憶起當時建立聽歌識曲團隊的初衷。
但在2019年初,聽歌識曲團隊也迎來了新挑戰(zhàn)。團隊成員Lester收到用戶們的反饋,稱原唱版本的歌曲都是秒速找到,但翻唱版本的歌曲卻難以識別。這在當時是一個全新的命題,由于音樂模式的逐步豐富,越來越多的歌曲有了各色翻唱版本,用戶們除了找原唱,對找翻唱、改編版本的歌曲也有很大的需求。
聽歌識曲1.0版本的識別原理,主要是“聲紋識別”,就像每個人都有自己的指紋一樣,歌曲和聲音同樣也擁有自己專屬特征的“聲音指紋”,聽歌識曲可以通過識別一小段音頻的聲紋,就能找出對應的歌曲,這對于尋找原版歌曲可謂無往而不利;但對于翻唱版、現(xiàn)場Live版等版本,由于聲紋的變化,確實難以識別。
針對這一問題,Ethan和隊友開始計劃將原有的聽歌識曲技術拓展到2.0版本,并成功實現(xiàn)“模糊識別”,目的是為了讓在看劇、看綜藝、刷短視頻或者身處在一些小型Live現(xiàn)場時,卻苦于找不到當時入耳的那首歌的樂迷,能輕松找到自己心儀的歌曲。“至今還記得,其中有一首歌叫《一曲相思》,就花了很多努力才實現(xiàn)可測。”Ethan團隊對于當時的“攻堅經(jīng)歷”記憶猶新。
功夫不負有心人,經(jīng)過一年艱苦的研發(fā)攻堅,業(yè)界首創(chuàng)的聽歌識曲2.0“翻唱識別”橫空出世,領先行業(yè),一騎絕塵。通過智能AI,它不僅能識別短視頻、綜藝里的多輪翻唱歌曲,還能識別Live、直播等諸多場景,精準匹配度大幅提升。
值得一提的是,團隊還制作了“離線系統(tǒng)”的小彩蛋,在歌曲第一次未能成功識別后,系統(tǒng)會在一周之內(nèi)自動向全曲庫發(fā)起請求,識別成功后,用戶會收到聽歌識曲小助手的反饋提醒。匠心換得真心,“他們的反饋特別好玩,收到私信后會驚訝地問,聽歌識曲后臺是不是有人工一直守著,是不是員工偷偷識別出來的。”團隊成員Jerry笑著說。
有好幾次,Jerry在看電影時發(fā)現(xiàn)前排觀眾的手機屏幕亮了,界面顯示的正是在使用QQ音樂聽歌識曲,“那時候的感覺,可能就是標準的幕后英雄。”聽得出Jerry的自豪感。
QQ音樂聽歌識曲功能
讓AI學會欣賞、辨別每一首歌,對樂迷的好處顯而易見:聽見更多好歌,不會錯過任何一首喜歡的歌。但在音樂創(chuàng)作層面,技術的革新,還將帶來更加深遠的影響。
改變:當技術服務于藝術
“在PDM誕生之初,我們也曾請新生代歌手帶著音樂作品來做內(nèi)部測試,發(fā)生了一些很有意思的事情。”Ben介紹。
“參與測試歌手”就有應嘉俐,不少聽眾都聽過應嘉俐的《涼茶》《那又如何》:“當時正好是國際Discovery頻道團隊來對QQ音樂‘黑科技’進行訪問,我和我的新作品體驗PDM系統(tǒng)的經(jīng)歷也有幸被拍攝見證。”在這次PDM的打分測試時,應嘉俐帶來了兩首全新作品《神游星期天》和《上山來》。
“我一開始覺得,《神游星期天》的分數(shù)不會比《上山來》更高,因為前者帶著我更多的個人印記,而《上山來》是一首命題作文,是為電影創(chuàng)作的插曲,編曲配樂都更加偏向流行。”應嘉俐告訴刺猬公社。
但PDM判定的結果卻出人意料:認為《神游星期天》的旋律更朗朗上口,更適合向受眾推廣。她對此感到十分驚訝,“打動我的也是打動PDM的一個因素,但是這個想法我并沒有告訴過PDM團隊”。
原來,《神游星期天》的旋律雖然安靜平緩,卻讓她傾注了非常深厚的感情,而《上山來》對她來說,更像是一篇“命題作文”。“超出我想象的是,PDM好像特別了解歌手創(chuàng)作時的情緒和微妙的思考似的,PDM在對歌曲情感的判定上,《神游星期天》的分數(shù)也要高很多,這跟我自己的情感感受很一致。”
這次打分,也讓應嘉俐開始重新審視技術。作為專業(yè)音樂人,她在打分之前對技術總是抱有疑問:“單從音樂技術上而言,就有非常多細化的標準,AI能夠做到專業(yè)嗎?”在看到QQ音樂的后臺系統(tǒng)后,她的想法大為改觀:“評價一首歌的所有細分門類和專業(yè)技術,都有完整的體系了。”
但讓應嘉俐感觸最深的,還是經(jīng)過PDM的打分,讓她更明白在創(chuàng)作上,要保持自己的初心,延續(xù)自己的風格,這才是創(chuàng)作的本質(zhì)。
讓音樂人能夠不受限制地表達內(nèi)心,同時又讓這些表達能夠走進億萬樂迷耳邊,“有了這些好的案例,這讓我們對技術有了更大的信心。通過PDM技術去找出滄海遺珠,酒香也怕巷子深,我們要找到懷才不遇的好音樂和音樂人,給他們更好的機會。”雷教授說。
其實,經(jīng)過多年深耕,QQ音樂已走出了一條深受認可的“科技匠心”之路。2019與2020連續(xù)兩年,在國際音樂學術界公認的最權威比賽——國際音頻檢索評測大賽上,QQ音樂(PDM) 技術團隊不僅在“預測識別”中取得突破性結果,一舉打破世界紀錄。同時,QQ音樂的“聽歌識曲”等音頻技術也奪得兩項世界冠軍,三項成績打破世界紀錄。當時連小馬哥都在朋友圈為產(chǎn)品獲獎成果點贊,這在內(nèi)部相當罕見。
除了在國際頂級技術舞臺上拋頭露面,QQ音樂還推出了“銀河音效”,將用戶“聽”的體驗全面升級,同時上線了全新黑科技“定制音效”——通過用戶耳形特征和聽覺特征的智能化分析,打造“私人訂制”體驗。最近,銀河音效又“上新”了針對揚聲器聽音的“外放環(huán)繞音效”和“車載定制音效”。編輯部的黃湘就絲毫不吝惜對音效體驗的贊美,“前者能夠省下一個小音箱的錢,而后者則是駕車出游聽歌必備。”
QQ音樂“銀河音效”上的“定制音效”
不僅在音樂實用技術上,QQ音樂多媒體技術團隊更是在科技向善的“科技+溫度”這條路上一路狂奔,基于當下年輕人對聽書這一“耳朵經(jīng)濟”的進階需求,QQ音樂已獨家研發(fā)并最新上線行業(yè)首個“AI有聲書”功能,尤其是語音合成AI主播“Q音電臺bot”,是業(yè)界首個可以朗讀出極具情感表現(xiàn)力的嗓音,第一個成功用“黑科技”表達“聲音中的細微情緒”,為用戶提供更加聲臨其境的有聲書體驗。
13世紀,意大利畫家借用更加巧妙的化學,大幅改良了一種名為“濕壁畫”的繪畫方法,讓墻壁上的繪畫能夠保存得更久,色彩更靚麗。得益于新興的技術,當時的畫家們可以用更加新穎的主題,在大面積墻壁上繪出栩栩如生的人物。近200年以后,米開朗基羅、達芬奇相繼用同樣的技術,繪下了他們的傳世名作,成為文藝復興運動的“最高瑰寶”。
這個例子看似和音樂界沒有關系,但科技和藝術創(chuàng)作從未分開,隨著科技的革新,堅持科技向善,憑借“科技+溫度”的藝術創(chuàng)作將可以用全新的方式釋放美——或許可以想象一下,在QQ音樂科技的步步“升溫”之后,會不會讓音樂創(chuàng)作,乃至我們每個人的音樂生活產(chǎn)生翻天覆地的變化?
將要發(fā)生的一切改變,值得拭目以待。
文章來源于“刺猬公社”,作者:刺猬君
評論
- 評論加載中...