「動画にナレーションを入れたいけれど、何を用意したら良いか分からない」 「自分の制作したい動画にはどの程度の音質が必要なの?」
動画広告の制作において、こうした音質に関する相談は非常に多く寄せられます。ただし結論から言えば、音質は「高ければ高いほど良い」とは限りません。動画広告においてナレーションの音質をどこまで追求すべきかは、その動画の目的や配信環境によって大きく変わります。
本記事では、広告代理店として数多くの動画広告制作に携わってきた視点から、音質を「どこまで追うべきか」を判断するための考え方を整理していきます。
目次
よくある誤解:「音質=成果」ではない
動画広告のナレーション音質について相談を受けると、「とにかく良いマイクを買えば解決する」「プロに頼めば間違いない」といった声をよく耳にします。もちろんそれが正解になるケースもありますが、すべての動画に当てはまるわけではありません。まずは「音質を上げれば成果も上がる」という思い込みを整理するところから始めましょう。
「高音質なら効果が上がる」は本当か?
動画広告の音質について相談を受けるとき、まず確認したいのが「なぜ音質にこだわりたいのか」という点です。多くの場合、「良い音質の方が広告効果が上がりそう」という漠然としたイメージがあるようですが、実はこの前提自体を見直す必要があります。
広告効果を左右する要素は、クリエイティブの訴求力、ターゲティングの精度、配信タイミング、そしてLP(ランディングページ)の設計など多岐にわたります。音質の良し悪しはその一要素に過ぎず、しかも必ずしも最も重要な要素ではありません。
視聴環境の現実を考える
動画広告の視聴環境について、いくつか重要なデータがあります。Meta広告(Facebook/Instagram)において、動画の大部分は音声なしで再生されており、2016年のDigiday報道によると、複数のパブリッシャーが自社動画の約85%がミュート状態で視聴されていると報告しています(※1)。また、Facebookのフィードでは動画がデフォルトでミュート再生される仕様になっているため、多くのユーザーは音声をオンにせずにスクロールしていきます。
※1 出典:Digiday "85 percent of Facebook video is watched without sound"(2016年5月)
一方で、YouTubeやTikTokのように音を出して楽しむことが前提のプラットフォームでは、ナレーションや音声が広告効果に直結しやすい傾向があります。ある代理店の事例では、YouTube広告においてナレーションありの動画はナレーションなしと比較して視聴率が2%以上高く、CVR(コンバージョン率)は約3倍という結果が出ています。
つまり、「音質が重要かどうか」はプラットフォームと視聴環境によって大きく異なるのです。「全部ちゃんとやらなきゃ」という思い込みを外し、まずは自社の動画広告がどこで、どのように視聴されるのかを整理することが先決です。
動画広告における「音質が効く/効かない」条件
ナレーションの音質にどこまで投資すべきかを判断するためには、いくつかの軸で動画を分類する必要があります。以下の判断軸を押さえておくと、機材選定や制作方針を決める際の「地図」として機能します。
音声情報が「主役」か「脇役」か
まず最も重要なのは、その動画においてナレーションがどのような役割を担うかという点です。ナレーションで商品説明や価値訴求を行う「説明型」の動画では、音声の聞き取りやすさが内容理解に直結します。一方、BGMと映像で雰囲気を伝え、テロップで情報を補足する「雰囲気型」の動画では、音質の優先度は相対的に下がります。
情報量の多寡
伝えるべき情報量が多い動画ほど、ナレーションの役割は大きくなります。複雑なサービス説明や、複数の機能を紹介するような動画では、音声によるガイドがあることで視聴者の理解が促進されます。逆に、シンプルな訴求で十分な動画であれば、テロップや字幕だけで情報を伝えきることも可能です。
ブランドへの影響度
コーポレート動画や、高単価商材のプロモーションなど、ブランドイメージに直結する動画では音質の重要性が増します。音質の粗さが「安っぽさ」や「信頼性の低さ」として受け取られるリスクがあるためです。一方、UGC風の広告やカジュアルな訴求を目指す動画では、あえて「作り込みすぎない」音質の方が視聴者に受け入れられやすい場合もあります。
BGMや字幕との関係
BGMが大きめに入る動画では、ナレーションの音質差は目立ちにくくなります。また、字幕を必ずつける運用方針であれば、万が一音声が聞き取りにくくても情報伝達の補完が可能です。逆に、BGMが控えめでナレーションがクリアに聞こえる動画では、音質の粗さが目立ちやすくなります。
動画と音声の関係例
① UGC風動画(音質△)
「これを買えば正解」というものではなく、目的に合った選択ができているかどうかが重要という点は、すべてのレベルに共通します。
このレベルでは「持っているもので始める」ことが基本です。スマートフォンやPCに接続できるイヤホンマイクがあれば十分で、収録ソフトはボイスメモアプリなど無料のもので対応できます。
「妥協」ではなく「戦略」としての低コスト収録
UGC(User Generated Content)風の動画広告が増えている昨今、すべての動画で高音質を追求する必要はないという認識が広まりつつあります。むしろ、あえて「作り込みすぎない」ことが正解になるケースも少なくありません。
【想定使用先】
- UGCに寄せた広告
- その他音声のクオリティにそこまでこだわらなくても良い動画、素人感が馴染む媒体 など
リアル感・スピードが優先される文脈
UGC風動画の強みは「リアルな感想」「等身大の声」として視聴者に受け取られやすい点にあります。スタジオ収録のようなクリアな音質や話し方は、かえって「広告っぽさ」を強調してしまい、視聴者の心理的なハードルを上げる可能性があります。
また、スピード重視でクリエイティブを量産したい場合、高品質な収録環境を毎回用意するのは現実的ではありません。スマートフォンとイヤホンマイクには、その場で収録してすぐに編集・配信できる機動力は があり、テストマーケティングにおいて大きなアドバンテージになります。
必要な機材とソフト
- マイク:マイク付きイヤホン/ヘッドホン
- ソフト:無料のボイスレコーダー
- その他録音機材:スマホ/iPad/PC
機材・ソフトと収録方法の解説
マイクについて
スマホやiPadに直接繋げられるマイクであれば、どんなものでも問題ナシ。オススメはApple純正イヤホンマイク(EarPods)で、ホワイトノイズの入りやすさはあるものの、イヤホンマイクの中では音質がかなり優秀です。ポイントは有線マイクを使用することで、無線マイクは電波が不安定になると音が飛ぶ可能性があります。
ソフトについて
オススメは「ボイスメモ」というボイスレコーダーで、iPhoneなど Apple製品にデフォルトで入っている音声収録ソフトです。他の無料ボイスレコーダーと比べ、音声が綺麗に収録できます。
簡単な編集ならCanva等で可能ですが、背景ノイズを消したい場合などはPremiere Proのエッセンシャルサウンド→ノイズの多い対話のクリーンアップ、またはエフェクトパネル→クロマノイズ除去、Adobe Auditionのエフェクト→ノイズリダクションといった機能を活用することも可能です。
イヤホンマイクを使う場合の工夫
話しながら体が揺れることでマイクが髪や肌に接触しノイズが入ることを防ぐために、マイクの設置方法を工夫します。

マイクの周りに布製のものを配置して、声の拡散を抑える
マイクの奥はできれば必須、可能であれば左右と上にも配置します。声の響き(こだまのようなもの)を抑えられ、収録場所の空間感が音に入ることを防げます。
マイク部分が口の高さあたりに来るよう設置する
ものにひっかけたり、洗濯バサミでカーテンに留めたりなど。

マイクの前にティッシュペーパー(1枚)を設置する
声と共に出る息がマイクに当たりノイズが入るのを防ぐ、風除け(ポップガード)の役割を果たします。
(ティッシュペーパーは薄い2枚の紙が重なっていることが多いので、あらかじめ1枚に分離しておくと、ティッシュ同士のぶつかる音を防ぐことができます。)

この風除けはマイクに直接触れないように、マイクとの間に隙間を開けて設置するのがコツです。
マイクから5〜10cm離れた場所で話す
離れすぎると、空間の響きが入ってしまいます。近すぎると、息がマイクや風除け(ティッシュ)に強く当たり、ポップ音(ノイズ)が入ってしまいます。
UGC風を意識するあまり音質が「ただ悪い」状態になってしまうと、動画としての視聴体験自体を損なうリスクもあります。「リアル感」と「聞き取りやすさ」のバランスを意識することが重要です。
参考音源
イヤホンマイク:
※マイクは口から10cmほど離した状態です
② 賑やかなBGMの動画(音質⚪︎)
このレベルでは、PCに接続できるUSBマイクやピンマイクの導入を検討する価値があります。USB接続で手軽に使えるコンデンサーマイクは1万円前後から入手可能で、この価格帯でも①から大きく音質が向上します。収録はPCの標準ボイスレコーダーでも可能ですが、編集ソフト等でノイズ除去を行うとなお良いでしょう。
最も迷いやすいゾーン
多くの広告主が判断に迷うのが、この②に該当する動画です。完全なUGC風ではないがスタジオ収録までは必要なさそう、という中間領域で、特に縦型動画が主流の昨今ではこのゾーンに該当する動画広告が最も多いと言えます。
【想定使用先】
- BGMありの動画
- 縦型動画広告
視聴者が「違和感」を覚えるライン
声がこもっている、ホワイトノイズ等の雑音が入っている、部屋の反響が入っているといった状態は、視聴者に「安っぽい」「素人っぽい」という印象を与え 、信頼を損なう可能性があります。
また、BGMが入る動画において音質が問題になるのは、ナレーションとBGMの音質に「格差」が生じたときです。BGMはフリー素材であっても一定の音質で提供されることが多いため、ナレーションだけが明らかに音質が低いと、視聴者は無意識に違和感を覚えます。
必要な機材とソフト
- マイク:ピンマイク/ヘッドホンマイク/ダイナミック(単一指向性)マイク/ コンデンサー(無指向性)マイク
- ソフト:PCのボイスレコーダー/オーディオ録音ソフト/Premiere Pro
- その他録音機材:UGC動画用収録のような吸音の工夫/簡易防音ブース
収録方法の解説
マイクについて
最近はいろいろな種類のマイクがあり選ぶのは難しいですが、まずは身近なマイク機材を使って音声を録音してみて、違和感を減らす工夫をしていくと良いでしょう。コツとしては、マイクを口から少しずらした位置に設置することで息の音が入ることを防ぎ、音質をあげることができます。
コンデンサー・ダイナミックマイクは、場合によってはオーディオインターフェースなどの機材が必要になる場合もあるので、購入の際には注意が必要です。
コンデンサーマイクのメリット・デメリット
| メリット | デメリット |
|---|---|
| 感度が高い | 電源が必要 |
| 繊細な音を拾える | 振動や湿気に特に弱く、扱いに注意が必要 |
ダイナミックマイクのメリット・デメリット
| メリット | デメリット |
|---|---|
| 電源が不要なものもある | 感度が低い |
| 丈夫で比較的湿度に強い | ノイズが入りやすい |
参考:個人的おすすめの機材
ピンマイク:RODE SmartLav+
扱いやすく音質も申し分ないピンマイクです。屋外の音録り用なので、良くも悪くも音を広く拾います。
ヘッドセットマイク:Logi H390r
扱いやすいですが、音質にはクセがありパリパリとしたノイズが入りやすいため、マイクの位置は口の少し下あたりに設置し息がかからないようにすると良いでしょう。またマイク位置が口と近くなりやすく、大きい声を出すと音が割れるため注意が必要です。
格安コンデンサーマイク:SONY ECM-PCV80U
ロングセラーのコンデンサー(無指向性)マイク。若干こもった感じはありつつもコスパの良いの音質で、何よりノイズが目立ちにくいです。
参考音源
ピンマイク:
ヘッドセットマイク:
コンデンサーマイク:
ソフトについて
基本的にどの機材も、PCのボイスレコーダー(無料)で収録できます。
録音機材について
マイクによってはUSB接続が不可で、別途オーディオインターフェースの用意が必要となるものもあります。購入の際には、接続端子や電源の供給方法を確認しておくと良いでしょう。
その他環境についてなど
いかにポップ音(息のノイズ)などのノイズを入れず、声の音をしっかり拾わせるか、位置調整が大切になってきます。装着型ではなく固定型のマイク(コンデンサー・ダイナミックマイクなど)は、音量を一定に保つため、自分自身も動かないよう意識することが重要です。
③ ナレーションメインの動画(音質◎)
このレベルでは、コンデンサーマイクとオーディオインターフェースの組み合わせが基本構成になります。機材費用はマイクとインターフェースで3万円〜10万円程度が目安です。加えて、収録環境の防音・吸音対策、専用の録音 音響ソフトの導入も検討対象になります。ただし、このレベルの機材を揃えても、使いこなすには一定の経験が必要です。特にコンデンサーマイクは感度が高いため、環境音や話す際の口内ノイズ(リップノイズなど)を拾いやすく、収録環境の整備と収録テクニックがセットで求められます。「機材を買って終わり」ではなく、運用を含めた投資判断が必要です。
ここからは「制作」ではなく「投資判断」
ナレーションが動画の中核を担う場合、音質への投資は「コスト」ではなく「成果を左右する要因」として捉える必要があります。このレベルでは、内製で対応するか外注するか、スタジオ収録を行うかといった判断が、動画のクオリティと広告効果に直結します。
【想定使用先】
- 音声情報が重要な動画(BGM小さめ/無し)
- コーポレート動画
音質ミスがもたらすリスク
ナレーション等の音声情報が主役の動画において音質が低いと、視聴者が内容に集中できなくなります。聞き取りにくい音声は、それ自体がストレス要因となり、動画の離脱率を高める原因になりかねません。
また、コーポレート動画のような「企業の顔」となる動画では、音質の粗さがそのままブランドイメージの毀損につながるリスクがあります。「このレベルの動画しか作れない会社なのか」という印象を与えてしまうと、広告効果以前の問題です。
必要な機材とソフト
- マイク:コンデンサーマイク(無指向性マイク)
- ソフト:Cubase/Adobe Audition/OBS + iZotope RX10 など
- その他録音機材:防音ブース/オーディオインターフェース/スタジオ備え付け機材
収録方法の解説
マイクについて
コスパと音質が良いマイク(個人見解)を以下に記載します。
AT-2020 カバー音域が広くフラットな音質。コンデンサーマイクにしては安価でコスパ良し。安心と信頼のAudio-Technica製品です。
AT-4040 AT-2020のグレードアップ版で、低音・高音のカバーがより強く、感度が高く、ノイズも乗りにくくなっています。
AKG C-214 高音に強く、煌びやかで癖のない音質。筆者の愛用マイクで、9年くらい使っています。
UNIVERSAL AUDIO SD-1 中高音が得意でフラットな音質のダイナミックマイク。ラジオっぽい音声を録りたい場合などは特に重宝しています。
マイク(≒ポップガード=マイク前にある丸い形の風除け)との距離は10〜30cmほどを確保します(声の大きさや機材にもよります)。感度が良いためInputの調整が必要で、小さすぎるとノイズが入り、大きすぎると音割れしてしまうため、一番初めはある程度の調整と試し録りが必要です。ちょうど良い音量より気持ち小さめに設定しておけば、少し声を張った時にも想定外の音割れを起こさずに済むのでおすすめです。
参考音源
AKG-C214 (宅録(防音・吸音環境有)):
UNIVERSAL AUDIO SD-1 (宅録(防音・吸音環境有)):
ソフトについて
Cubase
世界的に有名な音響ソフトです。買い切り版(更新無し)と、サブスク版(機能のアップデートあり)の2種類があります。宅録勢の使用ソフトといえばこれだと思います。
Adobe Audition
Adobeソフトの内の1つで、本格的なオーディオ編集、ミキシング、マスタリングができます。音質は問題なく、綺麗に録れます。
その他録音機材について
オーディオインターフェース
オーディオインターフェースとは、マイクや楽器をPCに繋ぐための音響機器です。コンデンサーマイクの音声を収録するためには、オーディオインターフェースが必要です。オーディオインターフェースの質によっても音質が左右されます。
その他環境についてなど
コンデンサーマイクは性能がいいので、エアコン、扇風機、家の外の音(車の走行音や工事の音)などを拾ってしまいます。スタジオ収録でなければ、電化製品を極力消した上で、前方・上部・左右に遮音材・吸音材を設置し、さらに簡易防音ブースの中で収録する他、場合によっては収録の時間帯や曜日を工夫すると良いでしょう。
内製か外注か、スタジオか宅録か
このレベルの動画を制作する場合、選択肢としては以下のようなパターンがあります。
内製で宅録する場合
コンデンサーマイク、オーディオインターフェース、吸音・防音環境を整えた上で収録を行います。機材費用は数万円から十数万円程度で、継続的に動画を制作するのであれば投資対効果は高くなります。ただし、収録・編集のスキルが必要になるため、社内にそのノウハウがない場合は学習コストも考慮する必要があります。
ナレーターに外注する場合
プロのナレーターに自宅かスタジオで収録した音源を納品してもらう形が一般的です。費用は数万円から十数万円程度が相場で、品質は担保されますが、修正が発生した場合、追加の対応や費用が発生するデメリットがあります。
制作会社にまるごと依頼する場合
企画から収録、編集まで一貫して対応してもらえるため、社内リソースを割く必要がありません。費用は案件規模によって大きく異なりますが、品質管理と進行管理の負担を外部化できる点がメリットです。
どの選択肢が正解かは、制作頻度、社内リソース、予算のバランスによって異なります。まずは「この動画は何のために作るのか」を明確にした上で、最適な体制を検討することが重要です。
代理店として見てきた「失敗しやすい判断」
広告代理店として多くの動画広告制作に関わる中で、音質に関連してよく見かける「失敗パターン」があります。これらを事前に把握しておくことで、同じ轍を踏まずに済みます。
すべての動画で同じ基準を求める
「前回の動画と同じクオリティで」という依頼は非常に多いのですが、前回がコーポレート動画で今回がUGC風テスト広告、という場合には適用すべき基準が異なります。動画の目的に応じて「必要十分」のラインを設定することが、コストと品質のバランスを取る上で重要です。
後処理でどうにかなる前提で収録しない
「編集でノイズ消せばいいでしょ」という前提で雑な収録を行い、結果的に使い物にならない音源ができあがるケースは少なくありません。ノイズ除去は万能ではなく、声と一緒に入ってしまったノイズや反響を完全に除去することは困難です。収録段階で「使える音」を録ることが大前提であり、後処理はあくまで補正の範囲に留めるべきです。
目的と制作レベルが噛み合っていない
UGC風の動画なのにスタジオ収録を行う、コーポレート動画なのにイヤホンマイクで済ませる、といった「噛み合わない」制作判断も散見されます。前者はコストの無駄、後者は品質不足によるブランド毀損リスクがあります。動画の目的を明確にし、それに見合った制作体制を組むことが、失敗を避ける最も確実な方法です。
機材投資だけで解決しようとする
高価なマイクを購入すれば音質が上がると考えがちですが、実際には収録環境(部屋の反響、周囲の騒音)や収録テクニック(マイクとの距離、話し方、滑舌)の影響も非常に大きいです。機材単体ではなく、環境・テクニック・編集を含めたトータルで考える必要があります。
音質は「目的に合わせて最適化するもの」
本記事の内容を一言でまとめると、「音質は高ければいいわけではなく、動画の目的に合わせて最適化するもの」ということになります。
動画広告において、ナレーションの音質は「伝え方の設計」の一部です。どんなに音質が良くても、そもそもナレーションが必要ない動画であれば意味がありません。逆に、ナレーションが重要な動画で音質が低ければ、動画全体の評価を下げてしまいます。
音質への投資判断は、以下の3つの観点から検討することをおすすめします。
その動画においてナレーションはどのような役割を担うか 主役なのか、補助的な要素なのか。この位置づけによって、求められる音質レベルが変わります。
視聴者はどのような環境でその動画を見るか プラットフォームの特性、デバイス、視聴状況を考慮することで、音質がどこまで重要かが見えてきます。
音質が成果やブランドにどこまで影響するか 広告効果への影響と、ブランドイメージへの影響を分けて考えることで、適切な投資判断ができます。
動画制作の中でナレーションが必要となった際には、ぜひともこの記事を役立ててみてください。



