Cubase 15:音樂製作人的 AI 救贖,還是「課金」陷阱?

 


音樂製作圈的老牌標竿 Cubase 迎來了第 15 代的重大更新。對於長期埋首於數位音訊工作站(DAW)的製作人而言,每一次的版本跳躍都像是一場關於「效率」與「荷包」的博弈。然而,Cubase 15 的登場似乎預示著一個更深層的轉折點:AI 不再時只是外掛插件的點綴,而是

正式進駐了軟體的核心。


這引發了一個值得深思的問題:當 AI 開始接手那些曾經需要數年苦練的技術時,我們是在變得更強大,還是正在失去對「工藝」的掌控?


數位煉金術:Cubase 15 的技術拼圖

在討論哲學問題前,我們不得不直視 Cubase 15 帶來的「黑科技」。這次更新最令人矚目的莫過於內建 AI 音軌分離(AI Stem Separation)。過去,若想將一段混合好的音訊拆解出人聲、鼓組與貝斯,往往需要求助於外部軟體。如今在專案視窗中點擊右鍵,AI 隨即如同外科醫生般精準地解剖音訊。對於熱衷於採樣(Sampling)與重混(Remix)的創作者來說,這無疑是縮短了靈感與實現之間的物理距離。


此外,Steinberg 與 Yamaha 深度合作推出的 OMNIVOcal (Beta) 虛擬歌手引擎,更是直接挑戰了傳統錄音的必要性。只要輸入歌詞與旋律,擬真的人聲便能代為吟唱。結合了動態與 EQ 的 UltraShaper 以及支援共振峰控制的 PitchShifter,讓聲音設計的可能性進一步擴張。


而在工作流微觀處,**「最後操作優先(Last Touched Priority)」的自動化功能雖然低調,卻是許多專業製作人眼中的救星。它消除了在繁瑣選單中大海撈針的疲憊,讓自動化軌道能隨著操作即時顯現。對於管弦樂配樂師而言,「單音符攻擊補償(Attack Compensation)」**的引入,則解決了虛擬樂器長久以來發音延遲的痛點,讓編配更趨於自然的聽感。


歷史的迴響:從硬體枷鎖到 AI 紀元

回首 Cubase 的演進史,這是一條從「實體控制」走向「雲端智能」的路徑。老玩家一定記得那個讓人又愛又恨的硬體加密狗(eLicenser),它曾是正版軟體的勳章,也是出門工作的夢魘。自 12 代擺脫加密狗、14 代引入類 Ableton 的調製系統後,Cubase 15 的問世,正式宣告了 Steinberg 邁入「AI 紀元」。


這種演進不單是功能的堆疊,而是思維的轉向。AI 不再是被排斥的異物,而是被內化為 DAW 的靈魂。這讓我們不得不思考,當軟體開始具備「判斷力」時,人類製作人的角色是否正從「執行者」轉變為「決策者」?


輿論的拉鋸:是進化還是昂貴的修補?

然而,在專業社群的討論區裡,並非全是讚美。一部分創作者對工作流維優化、特別是現代化的樂譜編輯器(Score Editor)感到驚艷;但另一群資深使用者則對此抱持懷疑,甚至戲稱 Cubase 15 應該命名為「14.5」。


爭議的核心在於「邊際效益」。對於已經擁有 iZotope RX 或 Spectralayers 的專業混音師來說,內建的 AI 音軌分離是否只是行銷噱頭?其分離品質是否足以支撐專業需求?此外,儘管 Steinberg 維持買斷制,但每年幾乎固定週期的升級費用,也被部分用戶視為一種「隱形訂閱制」。在創作工具日益飽和的今天,這筆升級費用是否花在刀口上,成為了鍵盤戰場上的熱門話題。


未來的地平線:VST 2 的落幕與跨平台大同

展望未來,Cubase 15 所代表的意義可能遠超當前的版本號。隨著對 .dawproject 格式的潛在支援,我們可能即將迎來一個「檔案大和解」的時代,讓專案在不同 DAW 之間流轉不再是遙不可及的夢。


同時,我們也必須面對殘酷的斷捨離。VST 2 插件的時代即將終結,這意義著許多承載著「老聲音」的舊插件將被迫退休。Steinberg 正強勢推動系統的輕量化與現代化,為未來的「智慧混音助理」鋪路——那將是一個 AI 可能直接幫你處理頻率衝突與動態平衡的時代。


結語:該捏緊錢包,還是大膽升級?

回到最初的問題:Cubase 15 值得升級嗎?


這取決於你如何定義自己的身分:


如果你是編曲派與創作者,OMNIVOcal 與旋律音型步進器(Melodic Pattern Sequencer)提供的靈感火花,絕對值得你點下升級鍵。

如果你是影視配樂師,更現代的樂譜編輯器與攻擊補償功能,將大幅優化你的交付效率。

如果你是混音派或極簡主義者,且手中已有一套成熟的 AI 處理工具,或許可以再觀察初期版本的穩定性後,再考慮是否跳入這場 AI 洪流。

Cubase 15 或許不夠完美,它在進步與守舊之間盤旋,在 AI 便利與工藝純粹之間掙扎。但不可否認,它讓我們窺見了音樂製作的下一個十年:一個技術門檻逐漸消失,而創意品味成為唯一護城河的未來。

立體聲麥克風:音響指南

 


一、為什麼一個麥克風就夠了(但兩個麥克風卻威力無窮)


想想單一麥克風。它忠實地捕捉到了真實的聲音,但卻顯得單薄——單聲道的現實片段。當然,這無可厚非,但它缺乏人類經驗中那種立體感。然後,就出現了「耳機時刻」:你按下播放鍵,突然間,人聲或弦樂四重奏不再是從揚聲器中傳出的;而是在你的大腦中產生的。這種感知上的奇妙源自於對耳朵的模仿。透過使用兩個麥克風,我們可以劫持大腦的進化機制,利用時間或音量上的細微差別,就像我們的耳朵能夠分辨沙沙作響的樹葉或響亮的和弦一樣。這裡的目標意義深遠。我們不只是在拍攝聲源的平面「影像」;我們正在憑空雕刻出一個完整的、三維的「聲場」。


二、立體聲先驅:認識立體聲的瘋狂科學家們


這種聽覺幻象的架構並非一朝一夕建成。它需要富有遠見的先驅者——立體聲的瘋狂科學家們,他們從扁平的音頻訊號中看到了空間潛力。其中最傑出的當屬艾倫·布魯姆萊恩,這位EMI的工程天才早在1931年就獲得了“雙耳”聲音概念的專利,而當時大眾甚至還沒有像樣的收音機。他開創性的「布魯姆萊恩對」——使用兩個呈90度角放置的8字形麥克風——為自然、相位一致的錄音樹立了標桿,這一標準至今仍然適用。


到了1950年代,迪卡唱片公司掀起了一場新的革命。為了讓管弦樂錄音聽起來既恢弘又穩固,工程師設計了著名的“迪卡樹”,實現了前所未有的全景寬度和絕對的中心穩定性。很快,歐洲的錄音方法也隨之而來。法國廣播公司 (ORTF) 和荷蘭廣播公司 (NOS) 的廣播員們對聲學物理學進行了深入研究,並製定了近乎重合的立體聲技術標準,以期在逼真、定位精準的立體聲像與嚴格的單聲道兼容性要求之間找到完美的平衡點。


三、工具包:五種操控聽眾耳朵的方法


為了建構這些聲音景觀,現代工程師運用了一套特定的工具包——本質上是五種不同的方法來操控聽眾的聽覺皮層,每種方法都有其獨特的空間概念。


首先是 XY(重合)配置。這是「穩妥之選」。透過完美對齊拾音頭,它可以保證清晰的聲像定位和絕對的單聲道相容性,使工程師免於相位問題的困擾。它仍然是捕捉原聲吉他緊湊、清晰的撥弦音色的完美選擇。


與之形成對比的是 AB(間隔對)設定。寬廣、飽滿、夢幻般的音色,是打造震撼鼓組吊鈸或捕捉大型音樂廳混響效果的秘訣所在。它巧妙地運用了延遲技術,讓聲音以略微不同的時間點流過各個麥克風。


接下來是ORTF(近乎重疊)技術。這便是「人聲的觸感」。它經過專門計算,模擬人耳之間的物理距離,賦予聲音高度自然的空間感,使其成為錄製合唱團和複雜樂團的理想選擇。


對於那些追求極致控制的使用者來說,中側(M-S)是後期「修復」的終極利器。它將中心訊號與環境邊緣分離,使製作人能夠在錄音結束後很久,依然能夠神奇地擴展或收縮立體聲寬度——這對於獨奏樂器來說,雖然聽起來不太自然,但卻非常有效。


最後,Decca Tree依然是重磅炸彈。如果你正在聆聽一部雄偉的漫威電影配樂,那麼你幾乎肯定聽到的就是Tree的聲音。它是大型電影音效的黃金標準,它不僅要讓人聽到,更要讓人感受到。


四、戲劇性:立體聲出錯之時


然而,玩弄聲學物理原理卻暗藏風險。立體聲拾音是一項在真實感和衝擊力之間不斷權衡的過程,一旦數學上的平衡失效,戲劇性的問題就隨之而來。想想相位的脆弱性。如果像AB對這樣的間隔麥克風處理不當,就會觸發「梳狀濾波」。突然間,你精心錄製的恢弘大氣的音效,在被壓縮到單聲道智慧型手機揚聲器或智慧型助理時,就會變成單薄空洞的聲音——就像一個罐頭。


還有令人恐懼的「中間空洞」。為了追求寬度而將左右聲道拉得太遠,中心聲像就會完全崩塌。揚聲器之間停止了交流,讓聽眾置身於一個脫節、不自然的空洞之中。


這種脆弱性引發了純粹主義者和製作人之間曠日持久的爭論。我們應該忠實地「捕捉房間」的真實聲學特性,還是將錄音室視為創造「超乎想像」的、經過美化的虛假現實的畫布?這是聲音新聞報道與聲音虛構之間一場深刻的哲學辯論。


五、未來展望:從雙耳到全三維矩陣

展望未來,傳統的左右聲道二元對立模式正在瓦解。我們正邁向全三維矩陣。
















人聲調音 效果器 Vovious

 









Vovious 聲稱其做法與傳統人聲調音公司截然不同。它能與業內頂尖公司一較高下嗎?

除了 Auto-Tune 和 Melodyne 等市場老牌巨頭之外,如今市面上還有許多值得稱道的聲樂調音軟體可供選擇,其中一些優秀的工具甚至內建在不同的 DAW 中。乍一看,推出Vovious——其開發者稱為「自然」的聲樂調音插件——似乎是一個相當大膽的舉動。但他們顯然相信 Vovious 能提供一些與眾不同的東西,那麼讓我們看看它是否能讓你放棄目前使用的工具….
Graphs & Models
首先要注意的是,Vovious 並沒有提供即時自動音高修正功能。它基於離線圖形化音高編輯環境,其原理類似於 Auto-Tune Pro 的圖形模式,既提供簡單的微調工具,方便用戶將音符調整到目標音高,也提供更精細的控制功能,並擁有完善的圖形化編輯環境。 Vovious 可以作為獨立應用程式運行,也可以作為傳統的 VST3/AU/AAX 插入插件運行,或者,如果您的 DAW 支持,也可以作為 ARA2 插件運行。在我的大部分評測中,我是在 Cubase Pro 15 中以 ARA 插件的形式運行 Vovious 的,但我也嘗試了其他幾種方式,它們都提供了非常流暢的使用體驗。

Vovious 製作了一段「解釋」視頻,暗示他們的軟體在音高轉換方面採用了略有不同的底層技術——這段視頻在其網站上,如果您對這篇評測感興趣,非常值得一看。影片中提到,他們會對音訊素材進行相當複雜的分析,進而決定諧波和共振峰的處理方式。當然,他們並沒有完全透露所有細節,但本質上,為了獲得更清晰的效果,該軟體似乎使用了人類聲道的數學模型。不過,所有這些複雜的技術都隱藏在幕後,對於使用其他圖形化調音工具的使用者來說,其使用者體驗應該非常熟悉





什麼是音響工程和聲音科學中 dB(分貝)

 在音響工程和聲音科學中,dB(分貝,分貝)這是一個極為重要但經常被忽視的單位。要理解 dB,首先要記住一個核心概念:dB 不是「絕對的數值」(如公尺或公克),而是「比例」或「相對值」。

以下為您詳細解析 dB 的意義與數學公式

一、為什麼要用dB (人耳的特性)

之所以不直接用物理單位(如聲壓單位 Pascal 或功率單位 Watt),主要有兩個原因:

  1. 範圍:人耳能聽到的最微弱的聲音與震碎耳膜的聲音,其能量總計總計1,000,000,000,000 倍(一兆倍)。用線性數字記錄非常不便,使用對數(Log)可以將其壓縮在 0 140 之間。
  2. 相對數獲取:人耳對聲音大小的捕捉是的。如果你把聲音的物理能量增加一倍,你並不會覺得聲音變大一倍;只有當能量增加很多的時候,你才會覺得「大聲了一點」。這符合對數的數學特性。

二、 dB 的數學公式

dB 的計算方式取決於你的測量「是功率(功率)還是幅值(Amplitude,如聲壓或電壓)」。在聲音世界中,我們大部分時間都在處理幅值。

1.針對「幅值」(聲壓SPL、電壓V、數位訊號號Level

這是音樂製作(如混音軟體裡的推桿)最常用的公式:

      


  •  您目前測量到的數值(如聲壓)。
  •         參考基準值(零點)。
  •         10為底的對數。
  • 快速計算的「經驗法則」(Rule of Thumb

  • 在混音或處理音訊時,記住這幾個數字非常有幫助:
    • +6 分貝:幅值(聲壓/電壓)增加約2
    • -6 分貝:寬度值減少為1/2
    • +10 分貝:人耳感受到「音量變大」2」。
    • +3 分貝: 電量增加約2(這對鍛造硬件很重要)。
    • +20 分貝:幅值增加10

    總結

    • dB 比例:它的描述是「現在這個聲音比參考基準大/小多少」。
    • 公式的核心是Log:它使巨大的物理數值變得符合人耳感知的線性閾值。

    •  
    S2S1=kI2
    the fraction with numerator cap S sub 2 and denominator cap S sub 1 end-fraction equals the fraction with numerator k center dot cap I sub 2 to the 0.3 power and denominator k center dot cap I sub 1 to the 0.3 power end-fraction equals 2


























    Kits Ai (人聲替換)試用

    Kits Ai (人聲替換)試用 強大的AI 工具幫助我們可以選擇不同的人聲 將歌曲變得更有趣多變

    還有更多強大的功能在Kits Ai

    值得慢慢體驗品嘗唷