Data活用の未領域に挑むAI Lab【イベント登壇レポート】

キャディでエンジニア採用を担当しております片渕です。

今回は2021年12月21日にキャディ主催にて開催したイベント

こちらに登壇した、テクニカルプロダクトマネージャーの今井(@imaimai0)とMLEテックリードの河合(@vaaaaanquish)がプレゼンテーションした内容を、イベントレポートという形でまとめております。

今月よりAI Labを創設しておりますキャディ、その創設背景や現状そして作り上げたい未来について、気鋭のエンジニア2人が語り尽くしたのが今回のイベント。

当日参加できなかった方はもちろん、参加された方も振り返りの意味でもご覧いただけると嬉しいです。

[toc]

キャディの現状とAI Lab 創設の背景

今月に誕生したAI Lab創設の背景ということで、まずキャディという会社の設立背景や事業概要・現状を、今井の方からお話しできたらと思います。

キャディとは

今井:

ミッションとしてはモノづくり産業のポテンシャルを開放することを目指していて、モノを作る側も設計する側双方の課題解決にチャレンジしています、

具体的には調達というところ、100年以上のイノベーションが起きていないです。

設計についてはCADだったり、製造だったらFA(Factory Automation)などもありますが、調達は人が手作業でやっているところもまだまだあるため、ここを起点に変革を起こしたいのがキャディという会社です。

事業概要

具体的に事業としてやっていることは、メーカーである発注者が作りたいものの図面をキャディに提供し、キャディがそれを加工会社に依頼する流れになります。

これだけでは、単なるマッチングサービスと変わりがないのですが、キャディでは検査・品質保証などの商流に入り込んでいます。

そのため、発注者側からみればキャディが製造・納品してくれるのと変わらないので、ファブレスメーカーという立ち位置にいるのが特徴です。

プロダクト

エンジニアが開発しているプロダクトは、発注側から設計図面をいただき、社内システムに入ることでユニークIDが発行されデータとなっていきます。

まず原価の計算を行うわけですね、どのくらいの価格で発注できるかを、車内の原価計算システムで算出します。

そしてどの加工会社に発注するかを定め、発注を行います。製造工程のサプライチェーンを管理するシステムも社内で内製しているのですが、いつ・誰が・何を作るのかを見ています。

その後、実際に作られたモノは、キャディでも船橋と大阪の2つに物流拠点を持っているのですが、そこに集めて検査を行い、最終的に発注元のメーカーに納品されます。

データの流れ

よって様々なデータをキャディが取っていて、それが図面ごとのユニークIDにひもづいているわけですね。

例えば価格を出すときに、部品や製造工程の情報を図面データから読み取ります。

発注したあとは、製造側の納期などの情報がひもづき、トラックできます。

なので、実際に納品する際の、物流の情報や品質(不良率など)のデータもわかります。

こうした一連の流れによって図面情報のユニークIDとQCD(品質・コスト・納期)情報が結びつきます。

私(今井)が入社した2021年1月ごろは、こうしたシステムが浸透しはじめ、データがたまるようになってきた頃でした。はじめの頃は1人でデータを探索していたのですが、4月ごろから有志で社内データを見るチームを作りました。

その時の様子を私(今井)のNoteにまとめ、河合が興味を持ってくれたのが、河合との最初の接点でした。

さて、我々が扱っている図面というものをみなさんはあまり見たことがないと思うので、少しご紹介します。

設計の図面というのは例として下記にも載せていますが、

文字情報から意味を抽出したり、図面の右下のNOTEというところ

有害なバリ・エッジなきこと

とあります。

こんな風に、製造業には定性的な情報もかなり多く含まれています。

有害とは何か?バリ・エッジはどの程度まで許容なのか?こうした箇所を言語化・定量化していくことでスムーズにデータとつなげることができます。

これから取り組みたい課題について

河合:

前提としてAI Labは今月立ち上がったばかりなのでまだ実績はなく、First Winを作りたいと考えています。

私は12月に入社したばかりで、あれこれ社内データを見ているところでしたが、待機問題に落とし込めば良さそうとか最適化すれば解決できそうというシナリオは想定しつつ、ヒアリングも重ねています。

図面といっても、人間が作っていますので曖昧さなどは製造業の中でも残っています。

例えば、とある部品加工を依頼したい時、何%の不良が出るのか。納期遅れの可能性なども事前に察知できれば、業界全体で不要な在庫を抱えなくて済むことになります。

要望とは異なるケースだったり、図面との差分というデータを持っているので、MLで使えたらと思っています。

今井:

キャディの中での大きなテーマとしては、シフトレフトですね。

リスクを前工程でさばき、図面をもらった段階でリスクなど分かるようにしたいです。

そのためにはQCD情報が製造側にとっては大事になるので、図面からQCDまでの連動とリスク洗い出しができ、その情報を持って交渉などができると理想です。

データの標準化

河合:

製造業ならではの課題の1つとして、データが標準化されていないことがあります。

とある会社とサプライヤーさんとのやりとり1つとっても、会社間でズレがあります。

例えば5mmのズレは許容という会社もあれば、1mmでもダメというケースもあります。

キズについても会社によって許容度が異なりますね。

精度1つとっても標準化されていないので、そこから関わっていくことを私はやっていきたいです。

社内にはざっくりとBigQueryのデータはありますが、標準化されたスコアづけなど、これからやっていきたいので。

また、図面もフォーマットに従ってくれる会社もあれば、半分くらい手書きだったりする会社もあります。

AI Labの目指す未来とは?

河合:

CTOの小橋とも話をしていたのは、図面の標準化がされていないので、図面のlinterのようなものが作れたらいいよね、ということでした。

3DCADのソフトがあり、製図という課題に対してアラートするような機能はあるが、MLでもっと先の工程を見越して流通の時になりそうな課題とか、コストなどにリンクするような図面linterを作ってみたいですね。

今井:

それは究極の姿ですね。Manufactureing-Oriented CADと言っていますが、データは集まりつつあるので、それらをどうつなげていくか?というのが大きなテーマになりますね。

河合:

製造業の業界上の課題になるが、特定の大きな企業から加工を毎年受けている会社だと、意思疎通ができればいいので図面情報を端折ってもいいんですよね。

だけど担当者が変わった時や、横展開するのが難しいという課題があるので、標準化できるかどうか。

CEOの加藤もそこに課題意識があり、その課題解決に取り組むのがキャディの未来の姿だと思っています。

キャディのデータとは

河合:

キャディのBigQueryのテーブルを見ていた時に、データそのものはきれいな方だと感じました。

おそらく先人のエンジニアたちが、どう構造化するかを必死に考えてきた結果なのだと思います。

ただ、物理世界を扱うデータだけあって「ノイズ」は多そうです。例えば2mmのずれなのか3mmなのかは、測定者や測定する機械で異なってくるので、そうしたノイズへの対処はAL Labの課題になるかなと。

今井:

図面解析プロダクトをやってきたので図面の話になるが、読み取れる情報が線画なので、あまり多くないんですよね。

パターンマッチングなど古典的な技術と、DLの技術が使えるところの中間にありそうな感覚です。

ドメイン知識については、書かれている1つ1つの情報にしっかり意味があるし、そこは難しさでもあり面白さでもあるなあと。

ちょうど5月くらいに、私(今井)がプロダクトマネージャーとして駆け出しだったころ、図面1万本ノックというものを社内でやっていました。

これはBiz側でどのように図面を見ているかをか解説しながら、読み方を教えてくれるというものなのですが、この経験で自分の解像度が上がりましたね。

図面を認識する順番があって、次はここを見ていくというような流れがある話です。

ドメイン知識を吸収するところはしっかりやらないといけないなあと思っていましたので。

河合:

ドメイン知識を重要視する雰囲気はキャディにあるなあと感じています。

実際に私も入社時の研修で船橋の拠点に行きましたが、加工品がどのように入ってきて、どのように審査した上で、どのように流通させるのか。

こうしたところを私のようなエンジニアにも、丁寧に説明してくれるところがありました。

また、AL Labでは課題を吸い上げることをやっているが、こういうことができそうだけどどうですか?と発信するとリアクションがきっちりつく文化がありますよね。

ヒアリングするとさらにドメイン知識を詳しく教えてくれたりするので、私ももっと社内・社外に出ることをやっていきたいです。

今井:

BizとTechが良い関係なので、様々なアイディアを双方が出してくれるので、クイックWinを出しながら、AI Labを成長させていきたいです。

一度に取り扱う図面規模の質問がきていましたのでお答えすると、先述した私のノートにも書いたのですが、10万とかそのくらいの規模を扱っています。

オーダーレベルで処理量が変わってくると、ちょっとした修正ではなく根本的な改善が必要になってきます。

アルゴリズムの高速化、インフラの面でスケーラブルなものが必要だなあというのは、河合と相談しながら決めてやっています。

河合:

データが意外と大きいというエンジニアリングの課題があると思っています。

今井:

1年前では図面解析のプロダクトがうまれたばっかりだったのですが、今では10万枚をさばくことがミッションになっています。

キャディのテクノロジーは技術ありきではなく、課題が難しいので最先端の技術を組み込むような、R&Dの先端にいること感じています。

無限に投資してもらうネタを作っていきたい

今井:

AL Labと並行して、テクノロジーのビジョンを描いているところなのですが、やはりシフトレフトを推進していきたいです。

Computable Supply Chainという構想もあります。

作る側はそれほどデータが取れていないので、製造の情報をリアルタイムで取ることができれば、QCD情報から提案ができるので、そうしたデータ分析をしたいと思っています。

そうすることで、設計から製造までのデータが標準化できて、シフトレフトの究極系ができます。

河合:

私もそのような提案をして、業界標準が動くところをやっていきたいですね。

そのためには要素技術、First Winにつながる提案基盤が必要だなあと。

今井:

製造と設計の真ん中にいるので、こういう入力をするとこういうものが出ますよ、というような夢をAI Labで見せていきたいですね。

また、CEOの加藤が無限に投資したいと言っているので、投資できるネタを作っていきたいです。

https://twitter.com/yushirodesu1/status/1470749166825795590

河合:

無限に投資してほしい人を集め、無限に投資されるようにしたいですよね。

AL Labが実験的にできる拠点などがあると、流通やオペレーションの最適化、ロボット自動化なども含めてできるんじゃないでしょうか。

それらによってデータが集まるサイクルも作ってみたいです。

投資されるためにも、あれこれやっていきたいと思っています。

今井:

MLはお金がないとできないので、クラスターを作ったり、ソフトエンジニアの採用なども積極的に進めたいですね。

AI Labの3年後には10名を超えていたら嬉しいですし、10年後は専門ごとに30人チームで動けたら楽しいなあと思っているので、巨額投資されるようなテーマをやっていきたいです。

また、技術的な話だと製造業はあまり論文になっていないのですよね。

特許などはあるが、製造業のデータがないので、学術的な貢献もできると思っています。

今回のようなイベントも、どんどんキャディが引っ張っていって、技術を引き上げていきたいです。

また、機械学習のコンペは主催者側になりたいですね、MLやDSへの業界貢献もできるといいですし、研究やOSSに貢献ができたらと考えています。

QA

ここでは寄せられて質問に対して、以下3点の質問と回答をまとめていきます。

データで解決できない点はどういうところだとイメージされていますか?

今井:

設計側で属人化されたノウハウは最後まで残りそうだなと思っています。

標準化は進め、暗黙知をナレッジにしていくことはやっていくが、個々人にひもづく技術的なところは残りそうだなと。

河合:

調達の領域を攻めているのですが、他の領域とつながることで解決できそうだなと思っています。

設計から考えるプロダクトがあれば良いのですが、標準化されていない課題があるので、バリューチェーンを通しで考えていく。

CEOの加藤の中ではイメージがあると思うので、それをどうモノにしていくのかがポイントになりそう。

今井:

どうしてもデータで予測はできるけれども不確実性は残ります。

物流は外部要因で影響を受けるので、例えば渋滞などで絵すね。

100%の予測は難しいですが、そうしたリスクを飲み込みながらモデルを作る必要があると思っています。

CADがデータ化されると楽になるのでしょうか?

今井:

そもそも調達がもらえる図面データが画像であるというのは製造業の特徴です。

調達の時に、知財の面からCADデータがもらえないシーンが多くて。

CADデータがもらえるとこんなことができますよ・標準化するとコストが下がりますよ、ということを示すようなものを作れると、CADデータをもらえるようになるのでは?と思っています。

河合:

知財まわりは確かに難しいかもしれませんね

設計側からデータをもらえないのであれば、先ほども出たように5年後にAI Lab工場のような、キャディがデータを作っていく話になってくると論文も書けたりするでしょう。

データをもらって加工していくプロダクトもあるし、我々がデータを作ってシステムを作り、そこで生み出したデータを使って改善を進めるなど、無限に投資してもらえたらできるかなと思うのでやるだけです。

BEでGraphDBを使っているがAIへの活用はどうですか?またRustは?

河合:

データ活用に使えそうです。グラフモデルとの接続はイメージできているのですが、扱うためには専門性が必要になるので、そういったデータに興味がある方とぜひカジュアル面談をやりたいですね。

Rustについては、機械学習モデルでTrainするようなことは直近では生まれてこないと思います。

Rustを使わなくてもPythonでも高速なのでメリットが薄い面もあります。

一方キャディの既存の資産、例えば図面解析だったりAPIがRustで書かれているので、そことのつなぎこみ。

そして、ONNXにモデル変換する深層学習モデルのプロダクトを立てるとかにチャレンジするのは既に出てきていますし、今後もありだと思っています。

最後に

いかがでしたでしょうか?

イベントの最後に、どんな人と一緒に仕事をしたいですか?と司会から質問があり、河合からは

河合: キャディの採用サイトにある文言が私は好きなんですよね、難しいことを面白がる、というもの。 キャディはこれまで難しく敬遠されていた課題に対して、MLやDSだとその折り合いをつけるところが面白いと感じる人と一緒に仕事ができるといいなあと思います。

というコメントが。

今井からは

今井: 私も同じですね。 キャディのエンジニアが、キャディはRPGのチームのようなもので、レベルアップしながら、そこで手に入れた武器を使って敵を倒していく、ということを言っていました。 都度向き合う課題に対して、都度勉強しながらやっていくことが必要になるので、これまでの課題が課題ではなくなってきますので、これまでの武器が使えなくなるということが普通に起きうるので、逆にそこに対してワクワクできる人がいいですね。

とコメントを残してくれました。

今後は、AI Labの成果発表ができるようなイベントも積極的にやっていきたいと考えています。

そうしたイベントに関する情報は、キャディのCONNPASSがあるので、登録をお願いできますでしょうか。

また、カジュアルに今井や河合と話をしてみたい!という方は、こちらより申し込んでいただけますと幸いです。

最後までお読みいただきまして、ありがとうございます。