コールドスタート問題とは?機械学習の仕組みと対策を解説(Google・Meta・Yahoo!を例に)

コールドスタート問題とは?機械学習の仕組みと対策を解説(Google・Meta・Yahoo!を例に)

 「新しいキャンペーンを立ち上げたのに、なかなか成果が出ない」「自動入札を導入したけど、パフォーマンスが安定しない」といった悩みを抱えている広告運用者は少なくありません。実は、これらの課題の多くは「コールドスタート問題」と呼ばれる現象に起因しています。

コールドスタート問題とは、新しい広告やキャンペーンにデータの蓄積がないため、機械学習による最適化がうまく機能しない状態のことです。車のエンジンが冷えた状態だとスムーズに動かないように、広告配信システムも「温まる」までに時間がかかるのです。

本記事では、この厄介なコールドスタート問題について、なぜ起きるのか、どうすれば乗り越えられるのかを、できるだけわかりやすく解説していきます。


そもそもコールドスタート問題とは?

まずは基本から押さえていきましょう。コールドスタート問題を理解することが、効果的な対策への第一歩となります。

コールドスタート問題とは、新しい広告キャンペーンや広告素材を配信する際に、過去のデータがほとんど存在しないために、機械学習モデルが「誰に」「いつ」「どのように」広告を見せればよいか判断できない状態を指します。

たとえば、ECサイトのレコメンデーション機能を思い浮かべてみてください。あなたがよく利用するサイトでは、過去の閲覧履歴や購入履歴をもとに「あなたへのおすすめ」が表示されますよね。でも、初めて訪れたサイトではどうでしょうか?サイト側はあなたのことを何も知らないので、的確なおすすめを出すことができません。Wikipediaのコールドスタート問題の解説でも、この現象はレコメンダーシステム全般に共通する課題として説明されています。

広告配信でも同じことが起きています。Google広告やMeta広告の機械学習システムは、過去のクリックやコンバージョンのデータを学習して「この広告はどんな人に響くか」を予測します。しかし、新しい広告にはそのデータがありません。だから最初は手探りで配信するしかなく、効率が悪くなってしまうことも少なくありません

さらに困ったことに、この問題は悪循環を生みやすい構造になっています。freeCodeCampの解説記事が指摘するように、新規広告はCTR(クリック率)の予測値が低く見積もられやすいため、オークションで不利になり、露出機会が減少しがちです。露出が減ればデータも集まらず、いつまでも学習が進まない。まさに「冷えたエンジンがかからない」状態が続いてしまうわけです。

広告配信の裏側で動いている機械学習の仕組み

コールドスタート問題を攻略するためには、広告配信システムがどのように動いているかを知っておくと役立ちます。ここでは、専門的な内容をできるだけ噛み砕いて説明していきます。

現代の広告プラットフォームは、大きく分けて4つの機械学習アプローチを組み合わせてコールドスタート問題に対処しています。それぞれの考え方を理解しておくと、「なぜ学習期間が必要なのか」「なぜ設定変更を控えるべきなのか」といった疑問への答えが見えてきます。

1つ目は「マルチアームドバンディット(多腕バンディット)」という考え方です。

ちょっと難しそうな名前ですが、考え方はシンプルです。カジノのスロットマシン(アームを引くタイプ)が並んでいる場面を想像してください。どのマシンが一番当たりやすいか、最初はわかりません。すでに何度か勝ったマシンを使い続けるか(活用)、まだ試していないマシンも引いてみるか(探索)。このバランスをとる問題です。

広告配信でも同じジレンマがあります。「すでに成果が出ている広告に予算を集中する」のと「まだ未知数だけど可能性のある新しい広告も試す」のと、どちらを優先すべきか。arXivで公開された研究論文では、このトレードオフを数学的に最適化するUCB(上限信頼区間)アルゴリズムが提案されており、理論と実験の両面で有効性が確認されています。

2つ目は「階層ベイズモデル」というアプローチです。

これは「似た者同士のデータを共有して学習を早める」という発想です。たとえば、新しいアパレル商品の広告を出すとき、過去に配信した別のアパレル広告のデータを参考にできれば、ゼロから学習するより効率的ですよね。

Amazon Scienceの研究では、この手法を商品検索に適用した結果が報告されています。新商品のインプレッション(表示回数)が13.53%増加し、新商品の購入数も11.14%増加したとのこと。しかも、全体の売上を損なわずにこの改善を実現できたそうです。

3つ目は「メタ学習」です。

「学習の仕方を学習する」という、ちょっとメタな(一段上の視点からの)アプローチです。過去にさまざまな広告の学習を経験したシステムは、「新しい広告が来たとき、最初にどう振る舞えばいいか」をパターンとして学んでいます。

arXivの研究論文「Learning Graph Meta Embeddings for Cold-Start Ads」では、新しい広告IDに対して、既存の類似広告との関係性から「良いスタート地点」を推定する手法が提案されています。これにより、データがほとんどない状態でも、従来の手法より高い予測精度を実現できたと報告されています。

4つ目は「探索と活用のバランス設計」です。

これは上記3つすべてに共通する重要テーマです。探索(新しい可能性を試す)を増やしすぎると短期的な成果が落ちますし、活用(実績ある選択肢に集中する)ばかりでは新しい発見ができません。

Northbeamの分析記事によると、Meta(Facebook)の広告配信システムは「探索モード」と「活用モード」を定期的に切り替えているそうです。探索モード中はROAS(広告費用対効果)が一時的に下がりますが、そこで発見した新しい有望ユーザー層が、次の活用モードで大きな成果をもたらすというサイクルになっています。

つまり、広告のパフォーマンスが日によって上下するのは、必ずしも「何かがおかしい」わけではなく、システムが学習している証拠でもあるのです。

Google・Meta・Yahoo! JAPANはどう対処しているのか

理論的な話が続いたので、ここで実際の大手プラットフォームがどんな取り組みをしているか、具体例を見てみましょう。各社のアプローチを知ることで、私たち広告運用者が取るべき行動のヒントが見えてきます。

Googleの取り組み

Googleは、広告オークションにおける新規広告の不利を軽減するため、バンディットアルゴリズムを応用した研究を進めています。Google Brainの研究者らによる論文では、階層ベイズバンディットを使ってタスク間で学習を共有する手法が提案されており、タスク数が増えるほど効率が良くなることが理論的にも実験的にも確認されています。

Google広告のプロダクトとしては、「オーディエンスシグナル」や「Smart Bidding」といった機能で、広告主がコールドスタートを乗り越えやすい仕組みを提供しています(詳しくは後述します)。

Meta(Facebook)の取り組み

Metaのエンジニアリングブログでは、「Explore-Exploit」フレームワークについて詳しく解説されています。これは、ユーザー体験を大きく損なわない範囲で探索(新しいユーザー層への配信テスト)を行い、そこから得られたフィードバックをモデル更新に活かす仕組みです。

広告セット内で複数のクリエイティブを用意しておくと、システムが自動的に配信を分散し、クリック率の高いものに比重を寄せていく。この挙動もバンディット的な最適化の一種といえます。

Yahoo! JAPAN(LINEヤフー)の取り組み

Yahoo! JAPANの技術ブログでは、ディスプレイ広告におけるコールドスタート問題への対処事例が公開されています。

Yahoo!広告では、新規に作成された広告キャンペーンは配信実績がないため、「どのようなユーザーがコンバージョンしやすいか」の予測が難しいという課題がありました。特に高額商品のように購入頻度が低い広告では、数日に1件しかコンバージョンが発生せず、予測精度が上がるまでに時間がかかるケースがあったそうです。

画像引用元:機械学習の階層モデルの適用でコールドスタート問題に対処する 〜 広告コンバージョン予測の事例 - Yahoo! JAPAN Tech Blog

この課題に対し、階層モデルを適用することで解決を図りました。広告データを「広告カテゴリ → 広告主 → キャンペーン → 広告グループ」という階層構造で捉え、上位階層(たとえば同じ広告カテゴリや同じ広告主)の傾向を、データが少ない新規キャンペーンの予測に活用する仕組みです。

分析の結果、最上位の「広告カテゴリ」の効果が最も大きく、階層が下がるにつれて効果の分散が小さくなることが確認されました。これは「キャンペーン単体のデータが少なくても、広告カテゴリや広告主の傾向である程度予測できる」という直感と一致しています。(なので、「掲載当初から自動入札を用いるべきか」についての回答も自ずと分かるかと思います)

これらの事例から見えてくるのは、大手プラットフォームは「短期的な効率を少し犠牲にしてでも、長期的な学習を優先する」という設計思想を持っているということです。広告運用者としても、この視点を持つことが重要になります。

広告運用の現場で知っておくべき実装上の課題

ここまでの内容を踏まえて、実際の広告運用で気をつけるべきポイントを整理しておきましょう。理論と実践の間には、いくつかの「あるある」な課題があります。

短期成果との両立が難しい

新しい広告やターゲティングを試す「探索」は、短期的には費用対効果を悪化させます。これが社内やクライアントとの摩擦を生みやすいポイントです。

対策としては、事前に「学習期間中は一時的に成果が落ちることがある」と説明しておくこと、探索用の予算枠をあらかじめ確保しておくことが有効です。「テスト予算」として10〜20%程度を切り分けておくと、心理的にも安心できます。

既存の知見との組み合わせが鍵

ゼロから学習するよりも、過去の実績やルールを組み合わせたほうが効率的です。arXivの研究「BayesCNS」では、既存のランキングモデルをガイドとして使い、「関連性の高そうな候補に絞って探索する」アプローチが提案されています。これにより、ユーザーに明らかに不適切な広告を配信するリスクを減らしつつ、効率的な探索が可能になります。

広告運用の現場でいえば、「過去に成果が出たオーディエンスの特徴」「効果があったクリエイティブの傾向」といった知見を、新キャンペーンの初期設定に活かすことが重要です。(ノンターゲによる最適化は、商材やサービス特性を選ぶ、再現性の観点でも考えてみるべき、という観点も大切です)

新規要素の評価指標を工夫する

新しい広告やターゲティングを、短期的なCPA(獲得単価)だけで判断するのは危険です。学習が進む前の段階では、エンゲージメント率(クリック率、滞在時間など)や、潜在的なリフト(改善余地)といった指標も参考にしましょう。

まだ学習中なのに、すぐに止めてしまう」というのは、よくある失敗パターンです。

Google広告で実践するコールドスタート対策

ここからは、Google広告に特化した具体的な対策をお伝えします。公式ドキュメントや業界のベストプラクティスをもとに、すぐに実践できる内容をまとめました。

学習フェーズの仕組みを正しく理解する

Google広告で自動入札(Smart Bidding)を使うと、「Learning(学習中)」というステータスを目にすることがあります。これがいわゆる「学習フェーズ」で、機械学習モデルがデータを集めて最適化を進めている期間です。

Google広告公式ヘルプによると、学習フェーズの長さは主に3つの要素で決まります。

要素影響
コンバージョン数多いほど学習が早く進む
コンバージョンサイクルクリックから購入までの期間が短いほど早い
入札戦略の種類戦略によって必要なデータ量が異なる

一般的な目安としては、「約50件のコンバージョン」または「約7日間」で学習が安定するとされています。ただし、コンバージョンが少ない場合は1ヶ月以上かかることもあります。HawkSEMの分析でも、学習期間は1週間〜1ヶ月と幅があることが指摘されています。

業界では「30日間で30コンバージョン」という経験則もよく知られています。Jyll.caの記事で紹介されているように、1日1件程度のコンバージョンがあれば、自動入札がうまく機能しやすいと考えてよいでしょう。

オーディエンスシグナルで学習を加速させる

学習を早めるための強力な武器が「オーディエンスシグナル」です。これは特にPerformance Max(P-Max)キャンペーンで効果を発揮します。

Google広告公式ヘルプによると、オーディエンスシグナルとは「狙いたいユーザー層のヒント」を機械学習モデルに与える機能です。完全なターゲティング指定ではなく、あくまで「このあたりのユーザーが有望そうですよ」という参考情報を提供するイメージです。

別のGoogle公式ヘルプページでは、オーディエンスシグナルについて「初期の学習フェーズを克服し、最適化を迅速化する助けになる」と明記されています。

具体的にどんなシグナルを設定すればよいのでしょうか。PPC Masteryのベストプラクティス記事では、以下の順序で追加することが推奨されています。

効果が高いオーディエンスシグナル(優先度順)

  1. 過去にコンバージョンしたユーザーのリスト(顧客メールリスト、購入者データなど)
  2. サイト訪問者のリマーケティングリスト(カート追加者、商品閲覧者など)
  3. カスタムセグメント(競合サイトのURL、関連キーワード、類似アプリなど)
  4. 興味関心・属性データ(インマーケット、アフィニティなど)

Mega Digitalの解説によると、シグナルが完全に反映されるまで1〜2週間かかることもありますが、長期的にはシグナルなしよりも大幅に良い結果が期待できます

ポイントは、自社が持っているファーストパーティデータ(顧客情報)を最優先で活用することです。「うちの商品を買う人はこんな人」という情報を、具体的なリストとしてシステムに教えてあげるわけです。

学習期間中に避けるべきこと

学習フェーズ中の「避けるべきこと」を知っておくことも重要です。せっかくの学習をリセットしてしまう行動を避けましょう。

30charactersの詳細な分析記事では、学習フェーズを再スタートさせてしまう変更として以下が挙げられています。

やってしまいがちな変更なぜダメなのか
入札戦略の切り替え手動CPCからスマート入札への変更などは、学習が最初からやり直しになる
目標CPA/ROASの大幅変更システムが「別の目標」と認識し、再学習が始まる
予算の急激な増減週20%以上の変更は学習に影響しやすい
ターゲティングの変更地域、年齢、オーディエンスなどの変更は母集団が変わるため再学習に
コンバージョン設定の変更計測対象が変わると、学習の前提が崩れる

Decocreの解説では、変更を加える場合は「週15〜20%以内」の範囲に留める(通称「20%ルール」)ことが推奨されています。

学習フェーズ中の鉄則は「触らず待つ」です。数日間パフォーマンスが悪くても、焦って設定を変えてしまうと逆効果。むしろ学習をリセットしてしまい、また最初からやり直しになってしまいます。

新規キャンペーン立ち上げの7ステップ

ここまでの知識を踏まえて、新しいキャンペーンを成功させるための具体的な手順をまとめます。この流れに沿って進めれば、コールドスタート期間を最短で乗り越えられるはずです。

ステップ1:コンバージョン計測を完璧に整える

すべての土台となるのがコンバージョン計測です。ここがズレていると、いくら優秀な機械学習でも正しく最適化できません。

確認すべきポイント

  • コンバージョンタグが正しく発火しているか
  • 重複カウントが発生していないか
  • コンバージョンの定義(何をもって「成果」とするか)が明確か

1キャンペーン1目標が基本です。複数の異なるコンバージョンを同時に追いかけると、システムが「何を最適化すればいいのか」混乱してしまいます。

ステップ2:初期の入札戦略を選ぶ

データがない状態でいきなり「目標CPA」を設定するのは危険です。Linear Designのガイドでも推奨されているように、まずは目標値なしの戦略から始めるのが安全です。

新規キャンペーンにおすすめの入札戦略:

  • コンバージョン数の最大化(目標CPAなし):まずはコンバージョンを集めることを優先
  • クリック数の最大化:コンバージョン実績が少ない場合のスタート地点として

十分なデータ(目安として50件以上のコンバージョン)が溜まったら、Target CPAやTarget ROASに切り替えます。

ステップ3:目標値は「緩め」に設定する

Target CPAやTarget ROASを設定する場合、最初は達成しやすい緩めの目標にしておきましょう。

Google Ads公式の「Finding success with Smart Bidding」の考え方を踏まえ、業界で推奨されている設定は以下の通りです。

  • Target CPA:過去の平均CPAより10〜20%高く設定(例:平均1,000円なら目標1,100〜1,200円)
  • Target ROAS:過去の平均ROASより10〜20%低く設定(例:平均200%なら目標170〜180%)

厳しすぎる目標を設定すると、システムが「達成は難しい」と判断して配信を絞ってしまいます。結果、データが集まらず学習が進まない悪循環に陥ります。

ステップ4:オーディエンスシグナルを設定する

前述のとおり、オーディエンスシグナルは学習を加速させる強力な武器です。

特にPerformance Maxキャンペーンでは、アセットグループごとにシグナルを設定できます。持っているデータを惜しみなく投入しましょう。

  • 顧客リスト(メールアドレスのリストなど)
  • サイト訪問者リスト(リマーケティングリスト)
  • 購入者と属性が似ているカスタムオーディエンス

ステップ5:2〜4週間は「我慢の時期」

ここが最も重要なポイントかもしれません。キャンペーン開始後、少なくとも2週間(できれば4週間)は大きな変更を加えずに待ちます。

RedTrackの2025年ベストプラクティスでも、「変更を加える前に最低1〜2週間は観察すること」が強調されています。

この期間中、パフォーマンスが不安定になるのは正常です。特に最初の5日間くらいは「探索」が多く入るため、CPAが高騰したりROASが落ち込んだりすることがあります。でも、ここで慌てて設定を変えてはいけません。

とはいえ、2〜4週間も待てない

現実には「2〜4週間も待てない」ケースも多い とはいえ、現実には「2〜4週間も待てない」ケースも多いでしょう。 予算の制約、クライアントへの報告義務、繁忙期へのタイミングなど、さまざまな事情があるはずです。

そうした場合の対処法をいくつか紹介します。

対処法1:予算を分割してリスクを抑える

全予算を新キャンペーンに投入するのではなく、既存の安定したキャンペーンと並行運用する方法です。たとえば、総予算の20〜30%を新キャンペーンに割り当て、残りは実績のあるキャンペーンで成果を確保します。これなら、学習期間中の成果悪化が全体に与える影響を最小限に抑えられます。

対処法2:手動入札で初動データを集める

自動入札の学習には一定のコンバージョン数が必要です。データが少ない初期段階では、あえて手動CPC入札や「クリック数の最大化」でスタートし、まずクリックとコンバージョンのデータを集めることを優先するアプローチもあります。目安として30〜50件程度のコンバージョンが溜まったら、Smart Biddingに切り替えるとスムーズに学習が進みやすくなります。

対処法3:マイクロコンバージョンを活用する

購入や申込みといった最終コンバージョンだけでなく、「カート追加」「フォーム入力開始」「商品詳細ページ閲覧」などの中間地点をマイクロコンバージョンとして設定する方法です。これにより、データ量が増えて学習が早まります。(相関・因果関係が薄いものだと学習は違った方向へ……)

ただし、最終的には本来のコンバージョンに最適化し直す必要がある点には注意が必要です。

対処法4:類似キャンペーンのデータを活用する

同じアカウント内に類似のキャンペーン(同じ商材、同じターゲット層など)がある場合、そのデータが新キャンペーンの学習に活かされることがあります。完全な新規アカウントよりも、既存アカウント内での新キャンペーン追加のほうが学習が早い傾向にあるのはこのためです。可能であれば、実績のあるアカウント内で新キャンペーンを立ち上げることを検討しましょう。

対処法5:期待値を調整してステークホルダーと合意する

最も重要なのは、関係者との期待値のすり合わせかもしれません。「最初の2週間は投資期間」「学習完了後に本来の成果が出始める」といった見通しを事前に共有しておくことで、途中で焦って設定を変えてしまうリスクを減らせます。週次レポートでは、CPA/ROASだけでなく「学習の進捗」も報告項目に加えると、関係者の理解を得やすくなります。

これらの対処法は状況に応じて組み合わせることも可能です。大切なのは、「学習期間を短縮しようとして、かえって学習をリセットしてしまう」という最悪のパターンを避けること。焦りから頻繁に設定を変えるよりも、上記のような代替策で時間を稼ぎながら、学習完了を待つほうが結果的に近道となります。

ステップ6:学習完了後に小刻みな調整を行う

学習フェーズが終わり、ステータスが「Learning」から通常表示に変わったら、少しずつ最適化を進めます。

このとき重要なのが「20%ルール」を守ることです。

  • 予算の変更:週20%以内
  • 目標CPA/ROASの変更:10〜20%刻み
  • 変更後は1〜2週間様子を見る

「目標CPAを1,200円→1,100円に下げる→2週間様子見→問題なければ1,000円に下げる」というように、段階的に詰めていくイメージです。

ステップ7:入札以外の要素も改善する

自動入札に頼りきりにならず、広告の質そのものも改善していきましょう。

学習フェーズを経た後は、「どの広告文がクリックされやすいか」「どのランディングページがコンバージョンしやすいか」といったデータが見えてきます。

  • クリック率(CTR)が低い → 広告文やクリエイティブの改善
  • コンバージョン率が低い → ランディングページの改善
  • 特定のキーワードだけ成果が悪い → キーワードの見直し

機械学習は「与えられた素材の中で最適化する」ものです。素材自体の質を上げれば、最適化の上限も上がります。

まとめ:コールドスタートを乗り越える3つの心得

最後に、本記事の内容を3つの心得としてまとめておきます。

心得1:機械学習には「温まる時間」が必要だと理解する

新しいキャンペーンがすぐに成果を出さないのは、システムの欠陥ではありません。むしろ、賢く学習しようとしている証拠です。最低でも2週間、できれば4週間は辛抱強く待つ姿勢が大切です。

心得2:システムに「良いヒント」を与える

オーディエンスシグナルや過去のコンバージョンデータは、機械学習にとって貴重なヒントになります。持っているデータを惜しみなく活用し、学習を加速させましょう。「うちの顧客はこんな人」という情報を、具体的に教えてあげるのです。

心得3:学習期間中は「触らない勇気」を持つ

数日パフォーマンスが悪いからといって、設定を変えてしまうのは逆効果です。20%ルールを守り、変更は小刻みに。焦らず、システムを信じて待つことが、結果的に最短ルートになります。

コールドスタート問題は、機械学習が広告配信の中核を担う現代において、避けて通れない課題です。しかし、その仕組みを理解し、適切な対策を講じることで、学習期間を短縮し、早期にパフォーマンスを安定させることは十分に可能です。

広告運用者としては、「AIが学習しやすい環境を整える」という視点を持ち、長期的な視野でキャンペーンを育てていくことが成功への近道となるでしょう。

参考資料

Google公式ドキュメント

学術研究・技術論文

Meta/Facebook関連

Yahoo! JAPAN(LINEヤフー)関連

業界分析・ベストプラクティス

関連記事

Meta Business Suiteの開設方法と設定しておきたいこと
Meta Business Suiteの開設方法と設定しておきたいこと
続きを見る
Facebook広告とInstagram広告の始め方|アカウント構築までに準備しておきたいこと
Facebook広告とInstagram広告の始め方|アカウント構築までに準備しておきたいこと
続きを見る
Yahoo!広告、2022年の主要アップデートまとめ
Yahoo!広告、2022年の主要アップデートまとめ
続きを見る