インタビュー

AIエンジニアが語る、 I’m Creative開発の舞台裏とShirofuneから得たもの 〜エンジニア 荒瀬晃介の場合〜

Shirofune広報担当

Shirofuneでは当初より、ツール開発からセールスや広報・マーケティング、ユーザーサポートなどのサービス展開に至るまで、積極的に社外のプロフェッショナル人材とのチーム作りへ投資し、プロダクト・サービス両面での成長に取り組んでいます。

社員として社内に入るわけでもなく、他とはちょっと違ったShirofuneのチームビルディングやその取り組みに、メンバーはどのような想いを持って参加しているのでしょうか。自身の働き方やキャリアへの影響も含めて直接聞いてみました。

7人目となる今回は、Shirofuneでクリエイティブ分析ができる新機能「I’m Creative」の開発者、荒瀬晃介さんが登場。メルカリの機械学習エンジニアとして数々の機能を開発してきた荒瀬さんは、どのような人物で、なぜShirofuneに関わることになったのでしょうか。その素顔に迫ります。

荒瀬 晃介 https://twitter.com/kosukearase
ソフトウェアエンジニア
東京大学修士課程在学中に株式会社メルカリでインターンを始め、修了後の2019年、同社に入社。入社後は画像認識システムや画像検索システムなど複数のプロジェクトでチームリーダーを務め、AIモデル作成からシステム開発、運用まで幅広く担当。2020年4月からはMercari USに異動。違反検知システムを開発するチームのリーダーを務めながら検索システムの開発にも従事。海外移住を機に同社を退職し、現在はフリーランスのエンジニアとしてShirofuneの新機能I’m Creativeの開発に携わっている。

AIで生活を変えたい。メルカリからスタートした機械学習エンジニアのキャリア。

もともと脳科学に興味があって。脳は非常に複雑ですが、仕組みとしてはニューロンとシナプスが繋がってできた反応の連鎖。意外とシンプルなんですよね。スーパーコンピューターを使って脳のシミュレーションができないかと研究をしていました。

その後AIや機械学習の領域に興味が移り、大学院では機械学習の研究をしていました。

そうです。修士1年の頃には既に、機械学習ブームでAIが騒がれていました。でもそのわりにAIで生活が変わったかというと、そうでもない。研究が進み、技術も進化しているのに、生活に応用されていないのはどこにボトルネックがあるんだろう?と、研究から実サービスへの活用へと興味が移っていきました。

特に興味を持っていたのが画像認識です。機械学習には大量のデータが必要で、ラベルの付いたデータだとなお良くて。要はこの画像は「犬」とか「猫」とかラベルが付いていると、機械学習用のデータとして使いやすいんです。

国内で大量に画像を保有していて、欲を言うとラベルも持っている企業はどこか考えたとき、思いついたのがメルカリでした。メルカリでは出品者が写真を撮影して、カテゴリやタイトルをつけて投稿しますよね。機械学習に携わりたいエンジニアにとって理想的な、ラベル付きのデータを大量に保有している会社でした。

メルカリでインターンができたら楽しそうだなと思って申し込み、修士の間はずっとインターンをしていて、そのまま新卒で入社しました。

機械学習からバックエンド開発まで。興味の赴くまま、さまざまなプロジェクトに携わったメルカリ時代。

最初に担当したのは、出品時に写真を撮影すると自動でカテゴリやブランドが識別される機能です。出品を手軽にするために開発された機能で、メルカリとしても最初期の機械学習プロダクトだったと記憶しています。モデルを作ってサービスに組み込んで運用をする一連を担当しました。

その後、欲しいものを撮影するとメルカリ上で見つかる画像検索機能(※現在はクローズ)を担当し、US版メルカリに異動しました。

US版では違反出品を検知する機械学習のモデルを作って運用をしていたのですが、次第に興味が機械学習から、それを支えるバックエンド開発へと移っていきました。

多くのユーザーに使われ、たくさんのリクエストが来る複雑なロジックを、いかに短いレスポンスタイムで安定的に処理できるか。そこに面白さを感じて、US版の検索機能に携わるようになりました。少し飽き性なところもあって、興味と共に居場所を変えてきた感じです(笑)。

検索機能って簡単に見えて、実はすごく奥が深いんです。

例えばメルカリで「iphone」と検索するユーザーは、iPhone本体を探していると思うのですが、アドホックに検索機能を実装すると、iPhoneケースやケーブルも「iphone」というキーワードを含んでいる以上、検索結果に出てきます。

検索結果に何を表示するとユーザーのニーズを満たせるのか。検索の意図を理解して取りこぼしがないように、関連度の高いものを上位表示させることが肝になります。やれることがたくさんあるんです。

そうです。ゆくゆくはアメリカへの移住を考えての異動でしたが、コロナもあって東京から。メルカリはこの検索チームを最後に退職しました。妻の海外赴任が決まり、思いきって移住することにしたんです。

メルカリ退職後はフリーのエンジニアとしてShirofuneの開発1本でやっています。

移住先で自作した、スマホの翻訳アプリ。ggerganov/whisper.cppをベースに、通信なしで、リアルタイムで文字起こしと翻訳ができるようカスタマイズ。オープンソースのモデルを手元で動かすのが趣味。

Shirofuneの保有データとAViCの広告効果改善の知見。両者が組み合わされば、オンリーワンのプロダクトが作れると開発に参画。

大学院の同期がベンチャーキャピタルで働いていて、I’m CreativeをShirofuneと共同開発しているAViC社とつながっていて。広告の分野で機械学習を使ったサービスを作りたくて、アドバイザーを探していると声がかかりました。

1回目は軽い顔合わせで、2回目はオフィスにお邪魔してI’m Creativeの構想を詳しく聞きました。

一見同じような動画広告でも、パフォーマンスに大きな差が出る。動画広告を自動で解析、要素分解して、パフォーマンスとの関連を定量的に分析するプロダクトを作りたいというお話でした。

これまで広告に携わったことがなかったので、この時はじめて広告パフォーマンスに関するデータを見ました。動画の視聴完了率やクリック率など、興味深いデータばかりでした。

この手のデータがShirofuneには大量に蓄積されている。さらにAViCはWeb専業代理店で、配信実績から仮説を立て、改善提案をするプロフェッショナルです。

Shirofuneが保有する大量のデータと、AViCの知見を組み合わせて機械学習のモデルにできれば、業界のゲームチェンジャーになりうる、ものすごいプロダクトが作れる。これは面白いと思いました。

まさにそうです。広告の世界は職人技的なところがありますよね。配信データを見て、ここが原因なのではないか?とあたりをつけて、改善のアイディアを出しPDCAを回す。この手の知見は言語化が難しく、競合他社が真似しづらい部分です。

データと知見、両方が揃うことで、機械学習をフルに活用したプロダクトを作ることができます。他に同じものを持っている会社がいないからこそ、オンリーワンのポジションで面白い挑戦ができそうだと感じました。人の知見をシステム化することにはもともと興味があったので、是非関わりたいと思いました。

当時はまだメルカリに在籍していたので、副業という形で週に1回、打ち合わせに参加するアドバイザーとしてスタートしました。2022年夏頃のことです。

そこから直接手を動かした方が早そうなところはエンジニアとして関わったりと、少しずつ稼働が増えていきました。

今まで携わったどんなプロジェクトとも違う、Shirofuneのユニークな開発スタイル。

Shirofuneのプロダクト志向、いいものを作るために一切の妥協をしない貪欲な姿勢は最初から一貫していて、とても印象的でした。

機械学習ではうまくいく例もあれば、いかない例もある。ある程度の正解率で進めることも多いのですが、彼らは「これくらいでいいか」という考え方はしないんです。

もっと良くできるんじゃないか?と常に考えて、そのためにリソースの投資は惜しまない。そのプロセスで必ずしもうまくいかないことがあっても、「必要なチャレンジだった」と捉えてくださる姿勢も印象的でした。

そういう意味でも、Shirofueはこれまで携わってきたどんなプロジェクトとも違いました。「いつまでにこれをお願いします」ではないんです。業務委託であっても一緒にプロダクトを作り上げるパートナーとして、かなりの自由度と裁量を与えていただきました。

ほとんどの開発はShirofune側で進めていて、僕が関わっているのは機械学習の専門的な部分です。かなり大規模なプロダクトなので、人的リソースと出来上がったもののクオリティの高さを考えると妥当な時間だと思います。

ただ正直なところ、僕は早くリリースしたほうがいいんじゃないかと勝手に焦りを感じたこともありました(笑)。

特に動画広告は静止画と比べてかなり複雑です。まずは静止画からリリースしてはどうか、一旦精度は置いておいて、パイプラインを組んでリリースを優先してはどうかとお伝えしたこともありました。でもここは動画からいきたい、時間をかけてでもしっかり作り込みたいと。

竹下さんって物腰が柔らかく、とても紳士的な方なのですが、内に秘める情熱や業界への想いは本当に熱い。たまにお酒を飲みながら、竹下さんが描く未来を語ってもらったり、色んなお話をしながら開発が進んでいった記憶がありますね。

技術ありきではなく、プロダクトありき。Shirofuneから学んだ、プロダクトファーストの姿勢。

いいものを作るプロダクトファーストな姿勢は大きな刺激になりました。

僕はどちらかというと技術に興味があるタイプなので、新しいイケてる技術にはすぐ飛びつきたくなるんですよね(笑)。不必要にしっかりしたものを作り込んでしまうこともあって。もちろんしっかりしたものを作るのは大切ですが、プロダクトに対して必要十分であればいい。

あくまでゴールはプロダクトで、そのためにこの機能が必要で、この技術が必要。技術ありきではなく、提供したい価値から逆算して取り組む姿勢、プロダクトとのバランス感覚には学ぶところがたくさんあります。今後も技術者として大切にしたいスタンスです。

そしてもう1つ。海外移住を決断できた背景にもShirofuneの存在がありました。移住をして最初の数ヶ月はフルタイムで働かず、生活の立ち上げをメインで考えていました。一方で収入がなくなることには不安があります。竹下さんは僕がライフイベントや生活を優先できるよう、フレキシブルに働ける環境を作ってくださいました。

移住前の1ヶ月はほとんど稼働できなかったり、その分、移住後は今までの何倍も働かせてもらったり。結局、紆余曲折あって今は東京に帰ってきたのですが、移住という決断ができたのはShirofuneという存在があったから。本当にありがたく感じています。

I’m Creativeはこれまで感覚に頼りがちだった動画広告の分析や改善の一部を代替できる、オンリーワンのプロダクトです。まずはたくさんの方に触っていただいて、その価値を感じてもらえたら、エンジニアとしてこれほど嬉しいことはありません。

今リリースしているのは、動画広告の要素を分解し、解析する機能ですが、目指している未来はもっともっと先にあります。僕の口からは詳しくお伝えできないので(笑)今後の更なる進化にご期待ください!

ものづくりの延長で、料理も趣味の1つ。珍しい食材を買って調理したり、外食で感動した味を再現したりと楽しんでいる。お肉はどれくらいの温度で調理すると美味しくなるか?など、料理をシステマティックに捉えて味を追求する姿勢はエンジニアならでは。
写真は鶏ハツを使ったインド料理。

<取材・文/藤井恵>

この記事を書いたライター
Shirofune広報担当
一覧に戻る

3分でわかるShirofune。No.1広告運用自動化ツール