ブログ - Baremetrics Japan

チャーンベースのLTV計算は間違っているのか? - Baremetrics Japan

作成者: Tomotaka Endo|Sep 3, 2021 4:00:00 AM

生涯価値(LTV)は、SaaSで従う最も重要な指標の1つです。この指標は、お客様が私たちのビジネスにもたらす価値を教えてくれます。

顧客獲得費用(CAC)から十分な情報に基づいた意思決定を行うために必要です。たとえば、期待以上にお金を使うべきではありません。しかし、私たちはどれだけの利益を得ることができているのでしょうか? LTVの見積もりはどのくらい正確ですか?

通常、LTVは「シンプルな」LTV計算を使用して推定されます。「シンプルな」LTVとは何かを一応確認しましょう。 以下の式は次のとおりです。

LTV =(ARPU)/(顧客数ベースのチャーン率)

これはアメリカのSaaSの業界では当たり前化しています。LTVを推定するためのシンプルで効果的な指標です。しかし、それは本当に効果的なのでしょうか?

この数式の分母に「チャーン」が含まれていることに注意してください。 

解約がLTVについて私たちを誤解させることがあるとするならば、それはLTVの計算についても誤解させるということです。

この投稿では、「シンプルな」チャーンベースのLTVメトリックが本当に正しいのかをテストします。それはどこで私たちを誤解させるのか?実際のLTVにどれだけ近づけるのか?あなたのLTVを調査するために是非読んでみてください。

LTVの実際の値がわかっているシミュレーションをいくつか実行して、「シンプルな」方法がそれを推定するときにどのように機能するかを見てみましょう。

シナリオ1:短期の加入者が多い停滞したビジネスのLTV

単純な以下のビジネス状況をシミュレートしてみましょう。停滞したビジネスで特に変化がなく、 サインアップ数は同じままです。 ドロップアウト数も同じままで、サブスクリプションの平均存続期間は変わらないと仮定します。 要約は次のとおりです。

  • 1か月あたりの平均登録数:30
  • 平均サブスクリプションライフタイム:2か月
  • サブスクリプション価格:$ 20 /月
  • 平均生涯価値:$ 40
  • 多くの短期加入者

以下のグラフは、既知のパラメーター(サインアップ率、サブスクリプションの有効期間など)を使用してデータを自分で生成するシミュレーションを示しています。「シンプルな」チャーンベースのLTVなどの指標を真実と比較することで評価できます。

上記のシミュレーションでアクティブなサブスクライバーの母集団を見てみましょう。

アクティブサブスクライバー数の人口が最初の20か月で急速に増加し、その後、シミュレーションの残りの時間、人口が赤い点線の上下で変動することに注目してください。 約15か月後、ビジネスは停滞し始めます。 紫色のアクティブサブスクライバー数線は、赤い点線から大きく場所を変えず、約72のサブスクライバー数のあたりで変動します。

停滞しているビジネスシナリオは、何も変化がないため、LTVメトリックが処理しやすいはずです。 真のLTVを取得するには、メトリックに十分なデータが必要です。 しかし、私たちの「シンプルな」LTVメトリックは、私たちが知っている真のLTVに近づくことができるのでしょうか?

上記の時系列で毎月LTVを計算してみましょう。 最初の数か月は少量のデータから始めますが、データセットが大きくなるにつれて、推定値は実際のLTV値に近づくはずです。

上のグラフは、毎月計算されるシンプルなLTVの見積もりを示しています。青い線は、この顧客ベースの実際のLTV値を示しています。ビジネスが成長段階にある間、「シンプルな」チャーンベースのLTVは真のLTVを大幅に過小評価していることに注目してください。

このシミュレーションでは、シンプルなLTVメトリックを使用してLTVを計算しました。次に、単純なLTVメトリックとシミュレーションのパラメーターであるLTVメトリックを比較して、それらが同じであるかどうかを確認しています。

シンプルなLTVはほぼゼロから始まります。顧客人口がまだ安定しておらず、多くの短期顧客が総顧客数と比較して大きいため、小さい値から始まっています。

サブスクライバー数が安定すると、単純なLTVは実際のLTVにはるかに近くなりますが、それでもLTVを過小評価する傾向があります。人口が安定したときの平均LTV推定値は32ドルです。これは、実際の値である40ドルよりも20%少なくなっています。それは過小評価ですが、驚くべきことに、そこまではひどいことにはなっていません!

完璧ではありませんが、上記のシナリオのシンプルなLTV計算も20%の違いはありますが、使用可能のようには見えます。

しかし、「シンプルな」チャーンベースのLTV計算は、顧客が平均して数年間サブスクライブするような、より典型的なユーザーの顧客ベースでどのように機能するのでしょうか。

ビジネス指標の分析を始めてみる

MRRやLTVなどを自動で追跡し、ビジネスの成長につなげましょう!!

シナリオ2:長期の加入者が多い停滞したビジネスのLTV

別の顧客ベースでシミュレーションを試した場合はどうなるでしょうか? それでも20%近くの誤差は生まれるのでしょうか? 短期加入者の数を減らしてLTVの見積もりはどうなるかを確認するため、新しいシミュレーションで試してみましょう。

以下のグラフは、そのシミュレーションを表しています。 サブスクライバーの分布が異なることを除いて、パラメーターは以前と同じです。 

このシミュレーションでは、短期間のサブスクライバーは少なく、サブスクリプションの平均有効期間は3.7年です。 平均サブスクリプションが3.7年間続く場合、実際のLTVは904ドルである必要があります。

これは、(3.7年) * (12か月) * (月額$ 20)を実行して計算されます。

「シンプルな」チャーンベースのLTVはその904ドルの数字に近づくことができるのでしょうか?

上のグラフの黄色い線は、シミュレーションの進行に合わせて毎月計算される「シンプルな」チャーンベースのLTV計算を表しています。最初は劇的に過大評価されていることに注意してください。どうしてこうなるのか?それは、長期加入者が多いからです。このプロセスの初期には、解約している顧客はほとんどいません。その結果、LTVの見積もりは高すぎなってしまいます。これは、サブスクリプションがこのように低いドロップアウト率(解約率)で永久に続くと予測しているためです。

ただし、顧客人口は3.7年後に安定します。 3.7年後、実際のLTV(青い線)に近い見積もりが得られます。さらに、前のシナリオよりもはるかに正確な見積もりとして表示されます。わずか数パーセントの差となります!

したがって、評決として、「シンプルな」チャーンベースのLTVは、顧客が長期滞在する場合でもそれほど悪くはなく、ビジネスにおいて根本的な変化はありません。

では、「シンプルな」チャーンベースのLTVが失敗するシナリオというのはあるのでしょうか?

以前の投稿で解約率が失敗したのと同じように、顧客人口が急速に変化している場合、「シンプルな」チャーンベースのLTVは破綻する可能性があります。

おそらく、ここでも同じ問題が発生します。これは、単純なLTV推定値が、最初の2年間のLTVを大幅に過大評価しているためです。

シナリオ3:成長しているビジネスにおけるLTV

このLTV問題をさらに調査するために、別のシミュレーションを試してみましょう。 上記のシナリオと同じようにすべてを維持して、1つの違いを設けます。

その一つが、毎月のサインアップ数を着実に増やしている優れたマーケティングチームがあると仮定します。そして毎月、平均サインアップ率が1%上昇するとします。

100か月後、毎日平均して2倍の顧客を獲得するはずです。 ただし、LTVは変更されません。 この極端な成長はLTVの見積もりを台無しにするのでしょうか?

これは、アクティブな顧客ベースのチャートです。

サインアップが増えるにつれ、アクティブな顧客人口は急増しています。

 LTVの計算はどのように行われるのでしょうか?以下のチャートを参照してください。

上のグラフでは、「シンプルな」チャーンベースのLTV推定値(黄色)がLTVの真の値(点線)に収束するまでにどのようになっているかがわかります。

推定値は最終的に真の値に収束しますが、それは約10年も後のことです。 この時系列の5年後でも、LTVの見積もりは50%もずれています。

「シンプルな」チャーンベースのLTV推定値は、顧客の母体数が個人のLTVとは何の関係もないはずですが、変化する顧客の母体数に敏感であるように見えます。

サブスクライバー数のサイズに対するこの感度は、「シンプルな」チャーンベースのLTV推定がチャーンに依存し、チャーン数が急速に変化する人口サイズに敏感であるためです。

LTVの別の指標を試してみましょう

LTVより良い指標を見つけることができるでしょうか? サインアップ率を変更しても歪まないものはあるのでしょうか? 「シンプルな」チャーンベースのLTV見積もりの代わりに、統計に基づいて作成してみましょう。

統計モデルを使用して、顧客の平均寿命を推定します。 データを使用して、サブスクリプション期間の統計モデルを構築します。

統計モデルとしてワイブル回帰(Weibull regression )を使用します。 モデルにデータをフィードすると、平均サブスクリプションライフタイムの見積もりが出力されます。

次に、平均サブスクリプションライフタイムに月額$ 20のレートを掛けて、LTVの見積もりを取得します。 そのような見積もりは「シンプルな」チャーンベースのLTVとどのように比較されるのでしょうか?

顧客のサインアップ率を上げながら前のシミュレーションを繰り返し、LTVを両方の方法で計算して比較してみましょう。

上のプロットでは、LTVの推定値を時系列で示しています。 「シンプルな」チャーンベースのLTV推定値は青で、統計的推定値は紫です。

「シンプルな」推定のずっと前に、統計的手法が実際のLTV値(点線)がどのように収束するかに注目してください。 統計的な見積もりでは、顧客ベースが安定した人口に達するずっと前に、約18か月のデータで実際のLTVに数パーセント以内の誤差で到達します。

対照的に、解約ベースの見積もりは、追いつくのに10年かかり、同じレベルの精度に達することはありません。 統計的推定は、単純なチャーンベースの推定よりも優れてい流ということがわかります。

統計は「シンプルな」LTVに勝るが、他の方法は?

興味深い補足として、上記のグラフの冒頭で、解約率に基づく推定値が実際のLTVを過大評価しているのに対し、統計的手法では過小評価していることに注意してください。どうしてでしょうか?これらの推定値はシンプルであるがゆえ、これらの歪みは両方とも発生するのです。彼らはデータを見る前に何も知らないので、不条理な見積もりから始めます。統計的見積もりはゼロから始まり、「シンプルな」チャーンは無限に近いところで始まります。

データが表示される前に、より良い出発点を提供することで、見積もりを改善できるのでしょうか?

モデルにある程度の変化を与えることで、統計的推定を改善できるます。モデルが、以前の経験まに基づいて、平均サブスクリプションライフタイムがどのように見えるかについての漠然とした考えから始まると仮定します。サブスクリプションの有効期間が約1年続くと予想するとします。幅広い推測になりますが、ゼロよりも現実的です。次に、データがロールインされると、見積もりが更新されるようにします。

より多くのデータを収集するにつれて、私たちの漠然とした出発点は消えていき、データが私たちに教えてくれるものはより正確になります。

これはは、統計と機械学習の正則化と呼ばれています。これは、モデルにバイアスを追加する手法で、優れた種類のバイアスになります。現実的なデータポイントを重視し、極端な観察を懐疑的に扱います。その結果、より良い見積もりが得られるようになるのです。

実際にやってみましょう!以下に、正則化を使用する新しい改善された見積もりを追加しました。これは統計的推定に似ていますが、ベイジアン事前確率( Bayesian prior)と呼ばれるものを利用します。

事前は漠然とした先入観のようなものです。それは私たちの見積もりを妥当なサブスクリプションの存続期間であると私たちが知っているものに近づけるので、私たちの見積もりは本物に近づき始めます。それがどのように機能するか見てみましょう:

上のグラフでは、改善された統計的推定値(緑)を追加しています。 最初の数か月で、新しい見積もり値が他の見積もりをどのように上回っているかに注目してください。 この改善は、私たちが意図したとおりに実行されています。

改善された見積もりは、初期の実際のLTV値に近くなっています。 ただし、データがロールインすると、2つの統計的推定値が収束し、最終的に区別できなくなります。

うまくいけば、チャーンベースのメトリックよりも優れたLTVメトリックを見つけることが可能であることを示しました。 チャーンベースのLTV推定は、特にデータが少ない場合、非常に不正確になる可能性があります。 これらのより良いメトリックに置き換えることができます。 さらに、それらを微調整することもできるため、SaaSの分野により適しています。

常に一貫したデータを

この記事でお分かりのように、指標を自分たちで管理しようとすると、非常に難解で誤差や間違いを犯しやすくなります。

BaremetricsStripeなどの決済プロバイダーと連携することで、自動でLTVを含めた様々な指標を計算して可視化してくれるので、一貫したデータを確認することができます。

まだ、うまくLTVを含めて様々な指標を管理できていない方は、Baremetricsの無料トライアルのサインアップして、今すぐにビジネスの状態を確認しましょう。