フリーランスの案件情報を眺めて感じた「データサイエンティスト」という職業の難しさ

AI・機械学習と言った言葉がトレンドになっている昨今、データサイエンティストを目指している若者(特に大学生や大学院生など)が多いのではないかと思っているので、そういう人たちに少しでも参考になればということでこの記事を書いています。

まず簡単な断り書きとして、このブログの内容はあくまでも単なる一個人の意見・見解です。またブログの内容の正確性や妥当性は一切保証致しません。

フリーランスなどの案件情報には社会のニーズが反映されている

今回のブログのテーマは、フリーランスの案件情報。今回チェックしてみたサイトは「フリーランススタート」です。

僕自身がフリーランスでの活動をしているということもあり、フリーランスの案件情報を気が向いたときに見るようにしているのですが、案件情報を見る目的はいくつかあります。

  • 単純に面白い案件があったら参画してみたい
  • 自分の技術レベルと、社会で必要とされている技術レベルの差を確認する
  • 社会でどんなビジネスが展開されていて、今どんなニーズがあるのかを外観する

一つ目は単純に、フリーランスとして条件がマッチしていて面白そうな案件があったら、話を聞いてみたら、ワンチャンジョインしてみたいなという話。

二つ目は、特に自分の技術レベルや経験が未熟な時にはすごく有効な方法だと思う。自分が初めてデータサイエンティストとしての仕事をもらえるようになった時も、何をすればいいか全くわからなかった自分がみたのは、求人情報でした。案件情報を見ると、必ず「必須スキル」の項目があって、自分の知らないツールやライブラリがあればすぐにわかるし、自分の技術スキルの習熟度が丸分かりになる。案件を掲載している企業側とすれば、できるだけ企業のニーズに合った人を見つけたいと思っているわけで、当たり前だけど「必須スキル」の条件を満たせる自分になれば仕事がもらえる確率は高くなっていく。

たくさんの案件を外観してみると、しょっちゅう頻出するベーシックなスキルと、滅多に出現しないマイナースキルとがあるのがわかってくると思います。ベーシックなスキルをまずは一通り学んでいけばよく、マイナースキルに関しては、自分が最終的に目指している領域で必要なスキルかどうかを判断していけば良い。

三つ目は、案件のタイトルだけを確認していくだけでも、社会のニーズがわかってくるというちょっと楽しい話。例えばデータサイエンス系の案件をスクリーニングして見ていくと

  • マーケティング自動化プロダクト新規開発
  • 某大手スマホゲーム案件
  • 人工知能(AI)裁判システム開発
  • AI無人レジ開発部門
  • 派遣事業向けレコメンドエンジンモデルの分析支援

などなど、具体的な案件を見つけることができます。「AIってこんな風に実際使われるんだ!」という、ざっくりした社会のニーズを知ることができるという点で、とても面白いですね。

データサイエンス系の案件で求められていることの例

さて今回のテーマであるデータサイエンティストという職業に関して、実際に案件としてどんなスキルが求められているのかを具体的に見ていこうと思います。

  • PythonかRでのプログラミング経験(モデル構築)
  • SQLを使用した分析業務経験
  • 自然言語処理経験
  • 画像系AI案件の経験
  • 機械学習/深層学習/統計学についての基礎的な知識
  • 数理統計データ分析の経験
  • レコメンドモデルの作成経験

このざっくり感です(笑)。つまり「細かいスキルの条件とかはいいから、とりあえず実際データサイエンスを仕事でやってるよね?」というスタンス。

「Pythonのこのライブラリ使える?」とか「〜〜っていう機械学習のモデルの実装とかできる?」とか、そういう具体的なスキルを要求されるのではなく、「うちビッグデータあるから、色々分析とかして売上あげてよ」「自然言語処理とかうまく使って、優秀なチャットボット作りたい」みたいな抽象的なゴールにたどり着ける総合的な能力が求められる傾向が強いということですね。

「AIとかデータサイエンスとかよくわからない」

なんでこんなハードな状況(特にデータサイエンティストとしての仕事の経験がない学生や、これからデータサイエンス系に転職しようと考えている人たちにとって)なのかということを考察してみると、一言で言えば「AIとかデータサイエンスとかよくわからない」ということなんじゃないかと思っています。

これはAIとかデータサイエンス領域以外の人にとってはもちろんなのですが、それ以外の領域の人にとっても一定程度言えることかなと。つまり、AIとかデータサイエンスとかって、縦にも横にも広すぎて、何ができれば「立派なデータサイエンティスト」と言えるのか、データサイエンティストでもよくわからない(明確な定義をするのがとても難しい)んじゃないかということです。

kerasでモデル構築できたらデータサイエンティストなのか?
BigQueryでデータ分析できたらデータサイエンティストなのか?
最新のML/DL系の情報をキャッチアップできてる人がデータサイエンティストなのか?

データサイエンティストにも色々な種類の人がいて、色々な業界で活躍している人がいて、色々な知識や技術が世の中に溢れていて、そうしたものを一括りで表現するのはとても難しいですね。

これから「データサイエンティストになりたい」と思っている人がいたら、データサイエンスの中でも「自分はどの領域のデータサイエンティストを目指したいのか」よく考えてみるとやることが少し見えてくるのではないかと思います。