[Sales Marker 陳晨氏]急成長スタートアップを支えるデータ基盤の裏側 #データ負債解消

イベントレポート

2024-05-21

株式会社Sales Marker 取締役CTO

陳晨

アメリカワシントン大学セントルイス校修士課程終了後、LINE株式会社に新卒入社。全社横断ビッグデータプラットフォーム構築プロジェクトに従事後、日本マイクロソフトに転職し、AI＆ビッグデータ部門にて世界中のお客様に対しシステム設計から開発、運用までシステム全般をサポート。その後株式会社スタンバイにてリアルタイム分析基盤の構築をリードする。テクノロジーで社会の効率化に貢献したい想いにより、CrossBorder株式会社（現：株式会社Sales Marker）を共同創業。

「Offers」では、エンジニア・PM・デザイナー向けにキャリア、スキル、働き方についての役立つイベントを開催しています。無料登録・ログインで、人気のイベント動画は今すぐアーカイブ視聴可能です。動画を視聴して、最新の技術トレンドや実践的なノウハウを手に入れましょう！

→【限定配信】アーカイブ動画を今すぐ視聴する！

45本以上の人気テックイベントを見るまずは求人を見てみる

この記事の目次

データに関するアーキテクチャの変遷
どうすれば負債を避けた設計にできたのか？
視聴者からの質問に答える質疑応答タイムへ

Connpass詳細はこちら

アーカイブはこちら

資料はこちら

本日はスタートアップを支えるデータ基盤の裏側について発表していきますが、まずは弊社の製品のSalesMarkerについて紹介します。

皆さんは自社の課題を解決するツールを導入したい時は何を行うでしょうか。

エンジニアであれば、自社のサービスをオンプレからクラウドに移行したいと思った際に、どのようなクラウドサービスがあるのか、AWSやGCPと比べて何が違うのかといったことをインターネット上で検索すると思います。

実際にいろんな人に聞いてみても、Web上で検索した経験がある人は100%でした。現代はインターネットがベースの社会なので、購買プロセスの約60パーセントがWeb上で完了している背景があります。なので、何かを買ったり導入したりする前は必ずネット上で何かしらの購買検討が進んでいます。

我々が提供するSalesMarkerは企業を人の集合体だと見立てます。そして、この企業に属する人達がインターネット上でどういうものを検索して、どういう記事を見て、どういう行動を起こしているのかを分析して、この企業が今抱えているであろう課題や興味・関心の分野を特定してビジネスに応用するビジネスモデルを扱っております。

その結果、SalesMarkerをリリースしてから2年経ちましたが、2024年2月期の売り上げ(ARR)が15億円で、去年と比較して900パーセントの成長です。アメリカでユニコーン企業になるための指標と比べても約2倍の成長速度になっています。組織人数は、去年から現在にかけて20人→150人となっています。エンジニアは去年は3人でしたが今は25人に増えて、組織の規模も成長しています。エンジニアチームはアメリカ本社のGoogleなどから世界トップレベルのメンバーが集まってサービス開発を進めています。

事業開始の当初から500万件の法人データと370万件の人物データ、プラス50億レコードのインテントデータを分析しないと実現できないようなビジネスモデルだったので、創業当初から大きなデータを継続的に扱ってきた背景があります。

データに関するアーキテクチャの変遷

急成長の裏側でデータに関するアーキテクチャは結構変遷していまして、全部で6段階のフェーズがありました。

まずフェーズ1は創業当初です。要件としては、インテントデータと呼ばれるデータを分析した結果を法人データと掛け合わせてお客様に表示するという簡単なものでした。なので、データ構造はできるだけシンプルにして、Amazon Auroraを使いました。

しかし、サービス開発2か月後に急に法人データを部分検索したいという要望があり、さらに大量の検索を行う必要が出てきました。なぜなら、お客様のデータと突合してしまうので大量に名寄せを走らせる必要があったからです。

法人データは500万件あるので、MySQLではかなり負荷が高いような状態になってしまいました。この解決策として、OpenSearchという検索エンジンを導入することで解決しました。こちらがフェーズ2でした。

さらに2ヶ月後には、法人データだけでは課題解決に至らず、部署や人物データを導入する必要が出てきました。こちらがフェーズ3になります。当初は1つの法人インデックスでの設計だったので、この中に入れ込むことがかなり難しくてどうしようという感じでした。

また、ビジネス的な統合を考えると開発期間が2週間しか無かった状況でインデックスを増やすという決断に至りました。

なので、フェーズ3としては、

インテントデータ×法人データ
インテントデータ×部署データ
インテントデータ×人物データ

が別々のインデックスに存在しているというデータ構造になりました。

ただ、OpenSearchではインデックスが分かれると基本的に結合できないデータ構造になっています。

お客様から法人データ・部署データ・人物データを横断して、さらに部分検索してインテントデータを組み合わせた結果が見たいという要望がありましたが、3つのインデックス構造である以上、その要望に合わせた検索ができません。頑張ればできますが、非常に効率が悪い状態になってしまいます。こちらがフェーズ4です。

解決方法としては、思い切ってリデザインしました。新しいインデックスを設定して、一定冗長化させることで横断検索が可能なシステム構造に変更しました。

しかし、ビジネスモデルとしては元々インテントデータがかなり蓄積されていて、過去のデータもなかなか削除できない状態でした。この解決の段階がフェーズ5になります。

そのため、インテントデータが2億を超えた時から、過去データを検索するオペレーションが入った時に著しくパフォーマンスが落ちてしまったんです。

そこでAmazonのAthenaを導入して、定期的に古いデータをアーカイブする仕組みを作ってHot/Coldのデータの振り分けを実施しました。HotのデータはOpenSearchで検索して、ColdのデータはAthenaから検索するという形になりました。

続いてフェーズ6ですが、先ほどのデータとユーザーデータを掛け合わせて調べたいというニーズへの対応について、データの検索エンジンへの同期頻度が日毎だったので難しい設定になっていたんですね。

ここは本当にシンプルに、リアルタイムにOpenSearchに同期することで解決いたしました。

以上、6回の大きなデータ構造の変化を遂げております。時間軸は、2022年3月サービス開始当初のフェーズ1から、 5月・10月と2回ありまして、2023年に関しては2回の大きな変更と、2024年に入って大きな1回の変更がありました。

スタートアップだったので、全ての変更は2〜3週間以内で行うような必要があったんですね。非常に早い意思決定を求められる環境で、同時に新規機能の開発も止められる状況ではありませんでした。

したがって、常にエンジニアの数は不足していて顧客数は逆に増え続けるので、必須開発要件も増えてきておりました。

どうすれば負債を避けた設計にできたのか？

先ほどのような難しい背景もありつつ、サービス開始から要件が大幅に変わって短期間での修正が求められていたので、完全に負債を避けることは不可能だったのではないかと思っております。

ただ良かった点としては、要件が変わった時点でコードベースで無理に対応せずにアーキテクチャレベルで素早く変更したので、大きな負債は作らずに済みました。

もし開発当初からOpenSearchなどの検索エンジンを導入せずにAuroraの検索で無理に進めていたら、全ての検索がAuroraに依存してしまって、大きな負債になっていた可能性が高いと考えております。

仮にもう一回やるのであれば、半年後に確実に起こることを常に思い浮かべながら設計することが大事だと思いました。

たとえば事業計画書通りに事業が進んでいく場合は、顧客数やデータ、エンプラのユーザーがこれだけ増えることは容易に想像できていました。

そのため、顧客データとの連携等はその時点で想像できたはずですが、当初はデータ設計する時にそこまで至りませんでした。もう少し長期的な視点を持ちながら設計していけば、先ほどの6つのフェーズのうち1つか2つは圧縮できて、よりお客様のためになる機能開発に時間を当てられましたね。

やはりデータやコードの特性を理解して、ボトルネックがある場合はシステムレベルで負債返済に取り組み、特に構造レベルのボトルネックがある場合は、コードレベルで無理して頑張らないことが大事だと思います。

逆に、変数に関しては無理に考える必要はないですね。たとえば、新しいデータと連携する可能性や新たな機能開発で既存のコードでは対応できなくなる可能性などですね。

事業開発計画に入っていなくて我々でコントロール不可能な部分に関しては、深く考えると開発の速度が落ちてしまうので、無理に開発する必要はないと考えています。

いかに素早くアジャイル開発を回していくかがスタートアップにとって大事です。

視聴者からの質問に答える質疑応答タイムへ

――ここからは、視聴者の方からの質問に回答していきます。まず1つ目は、「データ構造の負債を解消するために専用のメンバーを配置しているのでしょうか、それとも開発メンバーが機能アップデートと並行して進めているのでしょうか」という質問です。陳さんからご共有いただけますか。

陳：我々は全て同じメンバーがやっています。なぜなら、ここを分けると背景がわからないメンバーも入ってきてしまうからですね。基本的に解消する際は短期間で皆で一緒にやり切るという形で進めています。

――続いてtocknさん、お願いします。

tockn：弊社も同じで、特に負債解消の専門チームは置いていません。プロダクトを開発するメンバーが解消しています。クォーターの最初の2週間は非機能系の改善に当てるといった改善ウィークも設けたりして、色んな方法でプロダクト開発と共に並行できる施策を練っている感じですね。

――続いて大島さん、お願いします。

大島：Nayoseチームは歴史が長くて大きいチームになっていて、その結果システムとしても大きくなってしまいました。そのため、チームを分割してより改善しやすくなる構造にしています。

――続いて森山さん、お願いします。

森山：弊社も機能アップデートと並行してやっていますね。開発を進めるか、負債を解消するかを天秤にかけていて、場合によっては負債の解消を優先しています。

――最後に弓場さんはお願いします。

弓場：フツパーもチームを分けてはいなくて、開発メンバーが担う体制で今はやっています。

――続けて、「どれぐらいの時間をかけて負債を解消してきましたか」とのことですが、陳さんからお願いできますか？

陳：基本的には2〜3週間でやりきることを徹底しています。何か構造に問題が発覚した場合は一旦開発を止めて2〜3週間で全部やりきって、無理にその先に進まないという判断をしてきました。短期間で細かく、問題があるところだけ集中的にアタックする形ですね。

――続いてtocknさん、お願いします。

tockn：先ほどの回答と被りますが、改善ウィークみたいな形で1週間〜2週間を改善の期間に当てていますね。あとは、クォーター単位でプロダクトや非機能系の開発も含めて何をやるのかを整理する段階で期間を当てはめたりしています。

――続いて大島さん、お願いします。

大島：細かいところは2週間くらいの短期間でやって、どうしても歴史的経緯で大規模改修が必要なタイミングであれば半年〜1年ぐらいかけて、現在動いてるものをリプレイスする形です。

――続いて森山さん、お願いします。

森山：大体メンバーは複数人いるので、一人が負債回収して、もう一人は機能開発という感じでやっていましたね。負債回収をやると大体1ヶ月ぐらいかかります。それぐらいで今回の課題などは対応していました。

――続いて弓場さん、お願いします。

弓場：今回発表したデータベースの移行に関してはいきなり全部を変えるのではなくて、ステップを区切って1ヶ月単位で行いました。

――本日のイベントはこちらで終了とさせていただきます。登壇者の皆さん、視聴者の皆さんありがとうございました。

見逃し無料配信！続々追加！
45本以上の人気テックイベントが見放題

業界トップクラスの開発者たちが"実践で使える"最新技術トレンドを徹底解説！React、Next.js、Go、TypeScript、セキュリティ、テスト設計まで幅広くカバーした45本の厳選イベントを見逃し配信中。すでに4,000人以上のエンジニアが視聴申込み！⇒ 全45本のイベント一覧をもっと見る

【2025年3月最新】Offersで人気のテックイベントランキングTOP3

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞くバックエンドTSのイマ」

最新TypeScriptバックエンドフレームワークの実運用比較と今後の展望

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休エンジニア視点で考えるデザインシステ

大規模サービスの開発現場が語るデザインシステム導入の実際

【3位】「テストしやすいコードとは？tenntenn氏、渋川氏、zoncoen氏に聞くGoテスト設計最前線」

Go言語の第一人者たちが語る、実践的なテスト手法とベストプラクティス

45本の人気テックイベントを今すぐ見放題

※Next.js最新版解説、実践的なLLM活用法など旬のテーマも多数！期間限定見逃し配信中

この記事をシェア

あなたにおすすめの新着求人・案件

iOSエンジニア／急成長SaaS『jinjer』を支えるエンジニア募集

ｊｉｎｊｅｒ株式会社

雇用形態

正社員
勤務場所

週2-3回程度
稼働時間

裁量労働制
時給

年収 500万〜1,000万
技術スタック

iOS, Swift, AWS, Android, Kotlin, PHP

iOSエンジニア

[Sales Marker 陳晨氏]急成長スタートアップを支えるデータ基盤の裏側 #データ負債解消

データに関するアーキテクチャの変遷

どうすれば負債を避けた設計にできたのか？

視聴者からの質問に答える質疑応答タイムへ

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞く バックエンドTSのイマ」

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休 エンジニア視点で考えるデザインシステ

【3位】「テストしやすいコードとは？tenntenn氏、渋川氏、zoncoen氏に聞くGoテスト設計最前線」

あなたにおすすめの新着求人・案件

iOSエンジニア／急成長SaaS『jinjer』を支えるエンジニア募集

【AI×エンタメ】大手テレビ局向けDX案件を推進する開発PM募集

AIボイスボット×金融 ｜ PMO・運用保守支援（週2〜3日 / リモート中心）

AIボイスボット×金融×LLM ｜ PM・PdM（ハイブリッド / 週3〜5日）

【製造業×AI】生成AI・LLM開発｜CTO直下で挑むAIエンジニア募集

（スタッフエンジニア）AIプロダクト開発

（シニアエンジニア）AIプロダクト開発

（アーキテクチャー）AIプロダクト開発

（チームリード）AIプロダクト開発

（テックリード）AIプロダクト開発

【キャリア採用】プロダクトデザイナー（UI/UX）

【フルリモート／年収〜1000万】ワークフローSaaSのUI/UXデザイナー募集

【フルリモート／年収〜1600万】コード調査で顧客の問題を解決するCRE募集

【フルリモート／年収〜1600万】社内業務をAIで効率化するマネージャー募集

【フルリモート／年収〜1600万】承認ワークフローSaaSのAIエンジニア募集

【前編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【後編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【前編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【後編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【2025年版】エンジニア転職で年収アップに直結する資格選びと取得戦略

エンジニア 転職 30代で成功するための戦略と市場価値向上のポイント

AIエンジニアの年収は？AIエンジニアの稼ぎ方やなり方、収入アップまで徹底解説

AIエンジニアに向いている人の特徴とは？現役エンジニアが語る適性判断ガイド

【2024年11月最新】デザイナーの転職志望動機の書き方は？成功例とともにご紹介

【2024年11月最新】デザイナーの転職理由の例文を紹介！面接での答え方や伝え方のポイントも解説

【2024年11月最新】グラフィックデザイナーの副業事情とは？必要なスキル・経験から案件獲得方法まで徹底解説

【2024年11月最新】デザイナーの転職理由とは？よくある5つの理由と面接での伝え方を解説

Salesforce関連の自社製品開発で昨対150％成長！エンジニアがApexやLWCを学ぶ先にあるものとは？

毎月拡大を続ける「スニダン」開発組織。VPoE林氏が見据える次の打ち手と、OffersMGRへの期待とは

確認工数が1/10も削減に! OffersMGRで開発効率を改善し、数値を意識した組織にしていきたい。

Webエンジニアから「Salesforceエンジニア」へ。求められるスキルと理想の人物像とは

【2024年11月最新】スクラム採用とは何か？基本から成功事例までを紹介

【キャリア別】エンジニアが後悔しない転職タイミングと市場価値を高めるポイント

【2024年11月】コンピテンシー自己評価の例文の書き方。評価向上のための具体例を紹介

【2024年12月最新】リファラル採用による人材獲得の秘訣とは？成功事例と導入手順を解説

【後編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【前編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【後編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【前編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【2025年最新】エンジニア転職の面接攻略法！技術面接から年収交渉まで完全ガイド

【2025年最新】エンジニアが転職で年収アップを実現する5つの戦略と成功事例

【2025年最新】エンジニアが転職で失敗する5つの理由と成功への具体的対策

【2025年版】エンジニア転職で年収アップに直結する資格選びと取得戦略

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞くバックエンドTSのイマ」

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休エンジニア視点で考えるデザインシステ

AIボイスボット×金融｜ PMO・運用保守支援（週2〜3日 / リモート中心）

エンジニア転職 30代で成功するための戦略と市場価値向上のポイント