【急募】Python×LLMスクレイピング開発|東大松尾研・SBアカデミア出身

募集停止

AIエンジニア

【急募】Python×LLMスクレイピング開発|東大松尾研・SBアカデミア出身

UNCHAIN株式会社

UNCHAIN株式会社

AI要約(β)

「UNCHAIN THE WORLD」をミッションに掲げるAIスタートアップで、AIエンジニアとして未来を創造しませんか?PythonとLLMを駆使し、AI自動化プラットフォーム「NEURON」のWebスクレイピング基盤を構築。企業の「見えない業務ギャップ」を解消し、働き方を根本から変える挑戦です。東大松尾研・SBアカデミア出身の精鋭チームと共に、年収360万〜720万円の高水準報酬で、短期間での0→1開発に挑む。あなたの技術と情熱で、世界の業務を「UNCHAIN」し、キャリアを加速させましょう。

求人情報をご覧いただくには会員登録が必要になります

メールアドレスで登録する

給与・報酬

月給 30万円 ~ 60万円

稼働時間

80時間 ~ 120時間(週20 ~ 30時間)

雇用形態

業務委託

出社頻度

相談の上決定する

勤務地

東京都渋谷区道玄坂1丁目10番8号渋谷道玄坂東急ビル2F-C

現状と課題

私たちUNCHAIN株式会社は、東京大学松尾研究室・SoftBank Academia出身のCEOにより2025年7月に設立されたAIスタートアップです。「UNCHAIN THE WORLD」をミッションに掲げ、企業内の分断された業務やデータをAIでつなぐプラットフォーム「NEURON(ニューロン)」を開発しています。

創業メンバーには、18歳でソフトバンクアカデミアに採択された代表の朴をはじめ、NTT西日本で大規模データ基盤をゼロから構築したCTOの蛯名、15歳で起業し事業売却経験を持つCOOの原田など、ビジネス・技術の両面で強力なバックグラウンドを持つメンバーが集まっています。

現在、主力プロダクトである「NEURON」において、Web上の情報を動的に収集・構造化する機能の実装が急務となっています。今後2〜3週間という短期間で、LLMと連携した高度なスクレイピング基盤を構築する必要があり、即戦力となるエンジニアを募集します。

お願いする業務

AI自動化プラットフォーム「NEURON」に組み込むための、Webスクレイピング基盤の設計・構築を担当していただきます。PythonとLLM(OpenAI/Claude)を活用し、以下のスケジュール感で高速に開発を進めていただける方を求めています。

【具体的な業務スケジュール】 Week 1

  • 既存スクレイピングコード(Phase 1)の理解
  • URL登録・管理APIの設計・実装
  • LLMエンジニアとの連携設計

Week 2

  • LLM自動検出機能との統合実装
  • 動的スクレイパー生成ロジックの実装
  • 監視実行・結果取得APIの実装

Week 3

  • 複数サイトでのテスト・バグ修正
  • エラーハンドリング強化
  • 簡易デプロイ(Railway/Render等)

・東大松尾研・SoftBank Academia出身の勢いあるスタートアップで、創業期の熱量を感じながら働きたい方 ・単なるデータ取得だけでなく、LLMを活用した「知的処理」を含むバックエンド開発に関心がある方 ・短期間でプロダクトのコア機能(0→1)を作り上げる経験をしたい方 ・スクレイピングの「対ボット対策」や「動的コンテンツ解析」などの技術的課題解決に燃える方

技術スタック

募集要項

概要

求人情報をご覧いただくには会員登録が必要になります

メールアドレスで登録する

雇用形態

業務委託

給与・報酬

月給 30万円 ~ 60万円

稼働時間

80時間 ~ 120時間(週20 ~ 30時間)

出社頻度

相談の上決定する

勤務地

東京都渋谷区道玄坂1丁目10番8号渋谷道玄坂東急ビル2F-C

必須スキル/経験

Python開発

  • Python 3.10+ での実務経験(3年以上)
  • FastAPI または Flask での API開発経験
  • SQLite/PostgreSQL を使ったDB設計・実装経験

Webスクレイピング

  • Webスクレイピングの実務経験(2年以上)
  • Playwright、Selenium等を使った動的サイトのスクレイピング経験
  • HTML/CSS構造の理解、CSSセレクタ・XPathの実践的な使用経験
  • 複数サイトに対応したスクレイパー開発経験

LLM活用

  • OpenAI API または Claude API の使用経験
  • HTMLをLLMに渡して構造化データを抽出した経験
  • プロンプトエンジニアリングの基礎知識
  • LLM出力の検証・エラーハンドリングの実装経験

その他

  • Git/GitHub を使ったチーム開発経験
  • 既存コードベースの理解・拡張ができる
  • 短期間での高速開発経験

歓迎スキル/経験

  • HTMLパターン認識・汎用スクレイパー設計の経験
  • Docker/CI-CDの経験
  • スタートアップでの高速開発経験

サービス内容の詳細

UNCHAIN株式会社は、「UNCHAIN THE WORLD」をミッションに掲げるAIスタートアップです。企業のバックオフィス業務における「見えない業務ギャップ(分断されたツールや手作業)」を解決するため、以下のプロダクトを展開しています。

AI Workflow Automation Platform「NEURON(ニューロン)」: ユーザーが自然言語で依頼するだけで、AIが業務フローを自動生成・実行するプラットフォームです。APIが開放されていないレガシーツールやSaaS間も、AIエージェントがつなぎ合わせることで、組織横断的な自動化を実現します。今回の募集は、このNEURONが外部のWeb情報を取得し、業務に活用するためのスクレイピング基盤を構築する重要なポジションです。

選考フロー

  1. 書類選考
  2. 1次面接
  3. オファー面談

※急募のため、技術選考を兼ねた面接1回でスピーディーに決定します。

同じポジションの求人

おすすめのイベント

もっと見る
  • AI時代に適したリポジトリって?カウシェ・LayerXに聞く最新リポジトリ構成

    アーカイブ公開中

    AI時代に適したリポジトリって?カウシェ・LayerXに聞く最新リポジトリ構成

    昨今、AIエージェントの活用が一般的になってきたことで、「プロジェクト全体のコードを横断的に理解させるには、コードベースが一つにまとまっている方が適しているのではないか」という議論が増えています。 一方で、モノレポにはCIのパフォーマンスやコンテキストの絞り方など運用上の課題も存在し、組織規模やプロダクトのフェーズ、チーム体制などによって最適解は異なります。「どちらが正解か」を一概に難しいと感じている方も多いのではないでしょうか。 そこで本イベントでは、iOSやKotlinを含む複数言語のコードを一つのリポジトリに集約して運用されているカウシェと、バックエンド・フロントエンドともにモノレポ化を進めてきたLayerXの2社をお迎えし、それぞれのリポジトリ構成の実例をもとに、モノレポの実際を紐解きます。 前半のLTでは、カウシェからはモノレポになった歴史や複数言語を集約したメリット・デメリットを、LayerXからはリポジトリ統合プロジェクトの進め方や意思決定の裏側をお話しいただきます。 後半のディスカッションでは、両社を交え、モノレポにするタイミングや、CI・IDEとい開発体験に関する課題の課題、AIとの親和性を上げるための工夫やスコープの絞り方など、現場目線でさらに深掘りしていきます。 モノレポへの移行を検討している方から、すでにモノレポ運用で課題を感じている方まで、幅広いエンジニアのご参加をお待ちしています。

    開催日:

    2026年6月11日(木)19:00~20:00

  • 仕様駆動開発はやめた方がいいって本当?やって分かった仕様駆動開発の現在地と今後の方向性

    アーカイブ公開中

    仕様駆動開発はやめた方がいいって本当?やって分かった仕様駆動開発の現在地と今後の方向性

    昨今、AIコーディングエージェントの進化により、開発フロー自体を見直す動きが広がっています。その中で注目を集めているのが「仕様駆動開発( Spec Driven Development)」というアプローチです。 しかし現在は「仕様駆動開発」という言葉だけが独り歩きしており、具体的にどのようなフローであるべきなのか、ツールを使えば実現できるものなのかといった、実態を掴みきれないという声も多く聞かれます。 そこで本イベントでは、仕様駆動開発をはじめとしたAI駆動開発を実践されている中村充志氏をお迎えします。 前半のLTでは、、中村氏より仕様駆動開発SDDの基礎概念についてお話しいただき、ツールのデモを通じてその具体的な仕組みを提示いただきます。からハーネスとの組み合わせ、そして実際のデモを交えた実践までを紐解きます。 後半のディスカッションでは、仕様から出力される膨大なコードをどう効率的にレビューし、生産性を次のレベルへ押し上げるかという「実戦的なフロー」について議論していきます。また、その品質を支える「ハーネスエンジニアリング」という考え方も補足的に交えながら、現場で直面する疑問を紐解いていきます。 AI時代の開発フローに関心がある方から、仕様駆動開発の導入を検討されている方まで、幅広いエンジニアのご参加をお待ちしています。

    開催日:

    2026年5月28日(木)19:00~20:00

  • useMemo/useCallbackまだ書いてる?React Compilerで変わった開発体験

    アーカイブ公開中

    useMemo/useCallbackまだ書いてる?React Compilerで変わった開発体験

    React Compilerの登場以降、フロントエンド界隈では「これまで煩雑だったメモ化(useMemoやuseCallback、React.memo)が不要になるのではないか」と大きな話題になりました。 一方で、「本当にそのまま有効化して問題ないのか」「有効化による副作用や注意点はないのか」「従来どおりメモ化を残すべきケースはあるのか」といった不安の声も耳にします。実際に導入してみたチームからは、React Hook FormなどのライブラリやuseRefを使った実装でハマりポイントがあったという話も聞こえてきます。 そこで本イベントでは、React Compilerを有効化して1年以上本番運用されている浅見氏と、導入にあたって生成AI向けのルール整備まで仕組み化されているカケハシの大村氏をお迎えし、React Compilerの特徴や実際の導入プロセス、注意点・ベストプラクティスを紐解きます。 React Compilerが気になり始めた方から、すでに検証・導入を始めている方まで、幅広いエンジニアのご参加をお待ちしています。

    開催日:

    2026年5月20日(水)19:00~20:00

  • TypeScriptでAPI開発するなら知っておきたいRPC -tRPC、oRPC、HonoRPCとは-

    アーカイブ公開中

    TypeScriptでAPI開発するなら知っておきたいRPC -tRPC、oRPC、HonoRPCとは-

    昨今、バックエンドにTypeScriptを導入する事例は一般的になり、フロントエンドとバックエンドで型を共有することで開発効率を高めるさまざまなソリューションが登場しています。中でも「RPC(Remote Procedure Call)」を活用したアプローチは注目を集めており、tRPC・oRPC・Hono RPCなど複数の選択肢が存在します。 一方で、「そもそもRPCとは何か」「tRPC・oRPC・Hono RPCはそれぞれ何が違うのか」といった基本的な部分から整理したいと感じている方も多いのではないでしょうか。名前は聞いたことがあるけれど違いがわからない、どれを選べばいいのか判断がつかない、という声も少なくありません。 そこで本イベントでは、tRPCを実務で導入・運用されている海老原氏、oRPCやElysiaを活用されている柿氏、Hono RPCでマルチクライアント対応を実践されているよだか氏の3名をお迎えし、RPCの基本から各ソリューションの特徴・選定の考え方までを紐解きます。 前半のLTでは、柿氏、海老原氏、よだか氏の3名にそれぞれの視点からお話しいただきます。 後半のディスカッションでは、3名を交え、各RPCの推しポイントや課題、モバイル・Webの対応可能性を見据えた技術選定など、現場目線でさらに深掘りしていきます。 RPCという概念自体をこれから理解したい方から、すでに使っていて他の選択肢と比較したい方まで、幅広いエンジニアのご参加をお待ちしています。

    開催日:

    2026年4月23日(木)19:00~20:30

  • もうNext.jsには戻れない?次世代フルスタックフレームワークTanStack Startってなに

    アーカイブ公開中

    もうNext.jsには戻れない?次世代フルスタックフレームワークTanStack Startってなに

    昨今、Next.jsの急速な進化に伴い、そのブラックボックス的な実装に疑問を感じ、新たな選択肢を模索するエンジニアの声が増え始めています。そうした中、TanStack Queryをはじめとする「TanStack系ライブラリ」や、新たなフルスタックフレームワーク「TanStack Start」への注目が高まっています。 しかし、実際の運用において「Next.jsと比べて何がどこまで変わるのか」「TanStack系ライブラリを採用する具体的なメリットは何か」を明確にイメージできている方はまだ少ないのが現状です。 そこで本イベントでは、TanStack QueryやTanStack Routerを実務で活用されている寺嶋氏と、TanStack Startをプロダクション環境で実際に採用されている池内氏をお迎えし、Next.js経験者の視点からTanStack系ライブラリ・TanStack Startの実際を紐解きます。 前半のLTでは、まず寺嶋氏よりTanStack Startの全体像やViteエコシステムにおけるポジション、Next.jsとの比較を交えた概要を解説いただきます。続いて池内氏より、TanStack Startプロダクトにおける実践的な側面(デプロイ環境、認証基盤、データベース連携など)について、現時点での整備状況をお話しいただきます。 後半のディスカッションでは、お二人を交え、チーム開発での採用やAIコーディングとの親和性など、現場目線でさらに深掘りしていきます。 TanStackが気になり始めた方から、Next.jsからの移行を検討されている方まで、幅広いエンジニアのご参加をお待ちしています。

    開催日:

    2026年4月9日(木)19:00~20:00

転職に役立つノウハウ

もっと見る