\ 繼智慧型手機後的下一場科技革命! /
聲音經濟改變人們的溝通方式,使我們不再被「螢幕」綁架
已成為備受關注、充滿潛力與商機的全新藍海市場
★ 日本聲音產業發展先驅、新創企業顧問無私分享,業界情報首次公開
★ 收錄日本語音科技領域菁英對談,激發聲音經濟未來展望的更多想像
★ 從科技發展、市場潛力、廣告效益、內容製作全方位解析,帶來對聲音經濟的全新想像與啟發
好評推薦
▍網路趨勢觀察家│Mr. 6劉威麟
▍政大EMBA執行長│邱奕嘉
【聲音經濟的崛起】
Podcast的風潮只是一個開端,聲音的無窮潛力受到全球的關注,Google、Apple、Facebook、Amazon等跨國企業積極投入聲音市場,是現今商業界最受矚目的焦點。隨著語音辨識、深度學習等聲音科技的發展,讓人們從被螢幕綁架的現況中解放,大幅改變人與資訊的互動方式。
▍現已有超過三分之一的美國人擁有智慧音箱
▍台灣每5人就有1人收聽Podcast
▍2021年Podcast廣告年收益已超過10億美元
▍Spotify美國Podcast聽眾人數在2023年將成長至3,750萬
【聲音經濟是人類科技的終極目標】
從《星際爭霸戰》(Star Trek)到《鋼鐵人》(Iron Man),與電腦交談和溝通一直是科幻電影裡熟悉的場景,更是人類科技的終極目標之一,而我們已經離這一天越來越近。以目前來說,語音技術、人工智慧及物聯網最新進展已將這部分實現。智慧手機、智慧喇叭和其他設備能夠透過 Google 智慧語音助理、Siri和Alexa等語音助手來對設備進行指令。
【聲音經濟在各領域的革命】
▍醫療│利用患者的談話語調來診斷憂鬱症、失智症、帕金森氏症等疾病。
▍行銷│根據聆聽者手邊正在做的事情或當下的心情,投放個人化的語音廣告。
▍金融│以聲紋認證取代傳統的密碼與繁瑣的資料確認。
▍長照│減低高齡者對操作科技產品的障礙,提供更多精神與情感上的支持。
【聲音經濟就是未來】
在智慧型手機問世之前,沒有人能預測到在短短十年內智慧型手機能如此普及,影響力深入生活的每一個層面。隨著聲音科技的突破,現已出現不需要耳機就能傳送聲音的「音袋」技術,以及與真人語調無異的聲音合成技術。聲音經濟領域應用的深度與廣度都在不斷地擴展,下一波的科技革命,將由聲音經濟開始,徹底改變你我的生活!
作者
緒方憲太郎
Voicy公司負責人兼執行長、事業設計師、公認會計士。大阪大學基礎工學院、經濟學院畢業,2015年創辦醫療基因檢查事業TailorMed,2016年創辦Voicy,致力於開發、經營語音平台。
於此同時,緒方憲太郎也創辦支援新創企業的Delight Design公司。以替事業設計新價值為目標,也擔任10家以上新創企業的顧問與董事,從事資本政策、事業策略、服務設計、宣傳品牌設計、開放式創新設計,以及企業社長指導與網路建構。喜歡透過事業創造全新、令人熱血沸騰的價值,讓社會與生活變得更豐富。
譯者簡介
林詠純
專職日文譯者。譯有《比對話更關鍵的留白溝通術》、《關於人生,我這樣投資》、《哈佛×史丹佛 成就超一流邏輯思維的33問》等書。平常用眼過度,自從買了藍芽耳機之後就愛上聽語音內容,希望有人能夠開發自動念出社群網站追蹤者最新貼文的APP。
聯絡信箱:[email protected]
目錄
前言
為什麼現在是「聲音經濟時代」?/Clubhouse為日本帶來了什麼?/目前正發生什麼狀況?
\序章/ 聲音經濟的未來
\Voice1/ 為什麼GAFA會關注聲音經濟
→開始聽見語音科技的脈動
智慧喇叭在美國急速普及/急速成長的podcast市場/GAFA的舉動有什麼意義/手機之後的「大革命」到來/語音是「輕鬆取得資訊」的終極形式
→誰將掌控語音
霸主關注的兩大資訊/科技進步帶來革命/裝置的進步改變「聽的方式」
→裝在耳朵上的小型電腦
改變語音技術未來的無線耳機/落後美國與中國的日本/鎖定podcast的Spotify/付費訂閱比廣告更重要的中國
→為什麼日本的語音內容尚未成熟
語音內容的藍海市場/「聽的習慣」逐漸普及/Clubhouse進軍日本帶來的「發現」
→最高的有聲書成長率
疫情讓我們注意到「聲音」/語音科技的「市場」魅力
→錯綜複雜的語音技術參與者
演員到齊了
\Voice 2/ 只有具備「真本事」才能夠留在市場
→語音科技市場是個什麼樣的市場
「全新的市場」誕生/訊息傳播者爆炸性增加
→「忙碌的人」靠著語音彼此串連
為什麼職業婦女都在Voicy聚集/最適合你的形式是什麼
→我們能不能控制人心
人們受夠了被影片控制/操作欲望的時代/「人」本時代的媒體/真實傳達心情的「語音」/NFT加速擴大聲音市場
→語音的世界也在發展「個人化」
語音科技的發展如何改變市場/「不容易被討厭,印象深刻」的語音廣告/對贊助者的「共鳴」
→「Social+」時代的聲音
聲音的魅力在於「真實傳達想法」
\對談/ 從聲音廣告看見語音技術的未來
誰將成為語音搜尋的霸主/Google真心想要拿下語音市場/podcast的課題是目標不夠精準/語音廣告的潛力/適合「無形的商品」/語音廣告的未來風景/受不了「耳朵閒下來」/語音內容的現況/日本的人氣內容將從哪裡誕生/「真正的開始」到來
\Voice 3/ 語音技術將會如何改變未來
→不願承受風險的日本面臨的悲劇
語音的潛力開始受到矚目/擁有先進技術的大企業
→從三個面向理解語音技術
傳播訊息:從科技看見未來的可能性/大企業陸續加入語音產業/需求變高的「噪音消除技術」
→較難進入的的日本語音辨識技術領域
接收:語音辨識/全球語音辨識市場的成長/「接近人類」的自然語音表現/語音辨識技術的用途逐漸擴大/鑲嵌在生活空間裡的聲音
&a
試閱
誰將掌控語音
▍霸主關注的兩大資訊
每當新的介面誕生,多數人都會覺得「應該不會有更進一步的發展了吧」。譬如電腦出現、普及的時候,多數人都在無意識中深信這就是傳遞、接收資訊所發展出來的終極形式。
如果深陷於這樣的想法,那麼接下來出現的智慧型手機,看起來也只是電腦的延伸,不過就是電腦的縮小版。我們在智慧型手機登場的時候,想必已經看過許多企業受限於眼前慣用的介面,沒有趕上席捲世界的新潮流。
電腦在30年前登場,智慧型手機在10年前登場。但介面變化的間隔愈來愈短,智慧型手機不可能過了10年之後依然獨領風騷。
智慧型手機登場的時候,許多日本企業準備從原本以電腦為中心的商業模式轉型,卻因為慢了一步而陷入苦戰。現在可能又會發生同樣的狀況,新的介面又再度被GAFA等海外企業掌控也無所謂嗎?
資訊大致可以分成兩種:分別是文字、圖片、影片等「用手製作,用眼睛接收的資訊」,以及語音這種「用嘴巴製作,用耳朵接收的資訊」。Google 透過自動抓取(利用機器讀取收集)網路上的內容,一口氣掌控了前者;但後者尚未被任何人掌控。語音領域的霸主到底會是誰呢?
文字、圖片、影片的時代、智慧型手機的時代還會再持續一陣子,但為什麼語音科技革命會在現在這個時間點到來?
這場革命當然不是突然發生的。微小的潮流從好幾年前就開始持續,新的潮流一點一滴往這裡匯聚,涓滴細流逐漸壯大,現在即將成為一條大河。在漫長的助跑期間,科技逐漸進步、內容變得充實、裝置陸續登場、人們聆聽的習慣發生改變,因此眼前終於展開一片廣大的藍海。
到處都出現預兆,但儘管已經看見萌芽的兆頭,語音領域依然只有一小部分轉換成收益,日本也尚未誕生多少殺手級內容。語音領域仍是未開發的市場,成長的可能性極大。
▍科技進步帶來革命
為什麼現在終於迎來改變的時代呢?關鍵就在於「語音科技的進步」、「裝置的普及」與「『聆聽』習慣的擴大」。
分析技術在語音科技的進步中尤其特別重要。
其實語音的數位化早在很久以前就已經實現了,從使用唱片或錄音帶錄音的類比時代,轉變成將聲音以數位檔案保存、傳送、接收的時代,不是這一、兩天的事情。
但從前數位化的聲音,只是以數位檔案蓄音,儲存震動的高低,檔案裡只有成堆的數據。除非開啟檔案實際聆聽,否則不會知道裡面儲存了哪些語音或資訊。
不過,分析語音的技術在這幾年飛躍性地提升,機器逐漸能夠理解數位語音檔案的內容。而這項的技術進步,正是Apple 的Siri、Google 的Google 助理等語音助理誕生的背景。
現在網路上累積了龐大的資訊,提供幫助電腦進行深度學習(機器學習)所需的豐富素材,再加上能夠取得具備分析所需處理能力的電腦,這樣的技術才得
以實現。
話說回來,無法得知語音檔案內容的狀態到底有什麼問題呢?
直截了當地說,就是無法轉換成收益。語音檔案如果有辦法進行機器化分析,就能夠搜尋,廣告的可能性也會擴大,成為收益化的泉源。
回顧1990到2000年代初期網路上的文字資訊應該就會很清楚,從前寫在紙上的資訊變成數據,開始能夠利用機器進行分析,所以也能夠搜尋或推薦,進一步創造出金流。於是網路上的廣告收益,有好長一段時間超過了報紙、雜誌、電視等大眾媒體。
最具代表性的語音科技,就是將語音當成文字辨識的技術。如果沒有將人類說出的語言傳換成文字的語音辨識技術,就無法發展出Siri 或Google 助理等語音助理。這項技術對語言的依賴性大,因此中、英語領域的進展地特別快速。
深度學習需要大數據,使用人口多的中、英語必然具備優勢。另一方面,使用這個語言的人口規模直接就能轉換成市場規模,因此使用人口多的語言,參與的企業也多。
日語因為語言的特殊性,使用人口相對較少,語音辨識稍微落後中、英語,而這也會成為海外企業的門檻,使他們較難進入日語的領域。
除此之外,語音科技還有以機器區分人類語言與背景雜音(噪音等),進行消除雜音等處理、透過聲紋辨識個人等許許多多不同的技術。
其中,我特別關注分析接收者行動的技術,換句話說就是分析「聽到的人有什麼反應」,這個領域雖然尚未開拓,但將來有機會大幅發展。如果將這個技術與語音分析結合,就能知道什麼樣的語音能夠影響聽者的行動,語音廣告的可能性就會變得更大。這麼一來,語音搜尋廣告或語音的「搜尋引擎最佳化」(SEO),也能像Google 在文字、圖片、影片領域的發展那樣成為可能。