データサイエンティストに必要な3つのスキル|未経験者・社会人の為のオススメUdemy講座
データサイエンティストは、21世紀もっともセクシーな職種と言われ、高給取りの職種のひとつです。
最近日本でも有名になってきているので、聞いたことはがある人もいるでしょう。
そんなデータサイエンティストに必要なスキルと、それを身につけられる世界最大オンライン学習プラットフォーム「Udemy」でのオススメ講座をご紹介します。
データサイエンティストの定義は様々、人それぞれ
データサイエンティストに関しては、これだという定義は存在しません。
最近では職種名も乱立しすぎて、私も月に一回はデータサイエンティストと名乗る人と出会うようになりました。
属する企業や業界によって業務内容も必要スキルは多種多様です。
企業によっては、PhDを持っている人たちが日夜データと向き合って高度な数理モデルの開発検証をやっているところもあれば、元営業・マーケティング職種の人がエクセルやソフトウェアを使って利益の適正化を図っているデータサイエンティストもいるでしょう。
どちらがすごいとかない!!
ある業界では、世界最先端の数理モデルを駆使しても全く利益に紐付かない仕事しているデータサイエンティストより、ABテストでボタンの色を赤から黄色に変えてコンバージョン率が5%上げたデータサイエンティストの方が社内的に評価されていたりします。(実際にあった話)
なので、本気でデータサイエンティストになりたかったら、自分はどんな業界でどんなデータサイエンティストになりたいのか、よく考えましょう。
上記例の論文など執筆する、ゴリゴリ機械学習データサイエンティストになるには、大学院なのでコンピュータサイエンスなどの学位・修士・あるいは博士号などが必要になるので、学校に戻る必要があります。
そうではなく、基本的なスキルを身に着け、広義の意味でのデータ分析する職種(データサイエンティスト)になるは下記のスキルを見つけることをオススメします。
データサイエンティストの必要最低限スキル
データサイエンティストにはよく、下記の3つのスキルが必要されています。一つだけではなく、すべてのスキルが必要であることから、下記のようなベン図が使われることが多いです。
コンピュータサイエンススキル(Computer Science)
データ分析するためには、そのデータを用意する事と、処理するスキルが必要です。
データはすべてエクセルのようにキレイに揃っているわけでもなければ、そもそもエクセルでは開けない量のデータもあります。
データがない場合は、データを貯める仕組みを作ることからも必要です。
そういった業務には、基本的なSQLでデータ取得をすることから、PythonやR言語での前処理、コーディング能力が必要になってきます。
更にモデル作成や実際の分析でも必要になってくるので、とりあえずSQL・Python・Rを抑えておきましょう。
その他データの作り方や、テーブルの仕組みなどはSQLやPythonを学習していくうちに嫌でも覚えていくこととなります。
UdemyおすすめSQL講座
SQLにはUdemyの「はじめてのSQL」がおすすめです。
7時間とボリュームたっぷりの動画集中講座で、基本的な仕組みから、関数や演算子、テーブル結合まで網羅しています。
ここで基礎をサクッと学び、使いながらGoogle検索などで学んでいくのがオススメの学習方法です。
はじめてのSQL・データ分析入門 - データベースのデータをビジネスパーソンが現場で活用するためのSQL初心者向コース
Pythonデータサイエンティスト講座
データ分析で使うPythonを学ぶには、この講座が一押しです。
世界で5万人以上が受講した有名コースの、日本語翻訳版です。
基本なプログラミングから、分析方法まで具体的に学べます。
もともとは3万円近くした講座ですが、今は3,000円ほどと安くなっています。内容は変わりません。
データサイエンスの為のR講座
Rを使ったデータサイエンスの講座はこちらの「【R言語をゼロから理解していく】データサイエンスの実践例から学ぶデータ分析入門」がおすすめです。
R言語が全く知らない人でも始められ、データ分析での使用ケースに特化しています。
約5時間の集中講座で時間も短めですが、実際のデータを使った分析など濃い内容となっています。
Udemyでのレビューも高く、満足度も高い講座です。
【R言語をゼロから理解していく】データサイエンスの実践例から学ぶデータ分析入門
数学&統計スキル(Math & Statistics Skills)
データサイエンティストには、それらのデータ分析の手法や、結果のデータがどのような意味を表しているのか、そもそもどう分析するのかなどを知るために基本的な数学と統計の知識が必要です。
難解な公式や、証明をする必要ありません。
ビジネスでの活用が目的ならば、分析の手法・統計テスト・外れ値/異常値などについて最低限押さえておくべきでしょう。
基礎から学べる統計学
統計学を学ぶには、「【ゼロからおさらい】統計学の基礎」がおすすめです。
一番の売りは、短くて濃い。
統計学は誰でも学校でやったことがあるかと思います。
実は社会に出て忘れているだけで、重要な事は結構すでに習っているケースが多いです。
このコースはそういった所を短く、わかりやすく再学習できることができます。
AIについて数学を学ぶには
最近話題のAI、実は結構カンタンな数学の知識で、ある程度理解はできます。
前記に上げたPython講座を終えた方にぜひともおすすめしたい講座です。
AIを開発とまでは行きませんが、そもそもAIとはどのような計算をしているのか、どんな事が強みで何が弱みなのかなどを、数学と統計学とPythonを使って丁寧に説明しています。
AI開発エンジニアなどと会話するときに大変役に立つ内容です。
AIのための数学講座:少しづつ丁寧に学ぶ人工知能向けの線形代数/確率・統計/微分
担当分野での専門性(Subject Matter Expertise)
最後にデータサイエンティストに必要になってくるスキルが、担当する分野での専門性です。
それは時には業界についての専門性だったり、業務や仕組みについての専門性だったりします。
いくら高度なコンピュータサイエンススキルと、数学統計スキルを持った人でも、分析の対象の事や仕組みがわからなかったら、なんの力になりません。
足らないとこは専門家同士で補った方が良いということで、最近は専門家とデータサイエンティストのプロジェクトチームなども増えましたが、両者どちらもお互いの専門性については学ぶべきです。
でないと大体行き違いになり、失敗します。
例えば、ウェブ広告でデータサイエンティストをしていた人が、急に製造業のデータサイエンティストになれるかというと、そうではありません。
逆に言えば、その分野に精通しているデータサイエンティストは最強で、他のデータサイエンティストと差別化できます。
業界や商品それぞれに学ぶ的な事があるので、必要なスキルとしては一概にこれだと言えませんが、下記の基本的なビジネススキルは汎用的に使えます。
ネットで完結グロービスのマーケティング講座
マーケティングとデータサイエンスは相性が良いです。
どちらも数字を基準とした意思決定がなされる場面が多く、今ネット時代になっている中、より多くの正確なデータも取れるようになってきました。
マーケティングを学んでおくと、データサイエンティストしてのスキルも広がります。
下記コースでは、受けるには数十万円が必要な有名社会人ビジネス講座グロービスのマーケティング講座がたったの1万円以下で受けられます。
【グロービス学び放題】3時間でおさらい! マーケティング戦略・1年生の教科書
ビジネスモデルを体系的に学ぶ
ビジネスモデル構築のフレームワークで有名になった、ハーバードビジネススクール特別講義カール教授のまとめ講義です。
完全日本語対応で、ものすごい濃さの内容で3時間ちょっとの集中講座。
データや数字についてはあまり触れませんが、その根底にあるビジネスモデルの思考法を学ぶことで、新しいアイディアや分析の切り口が広がります。
ビジネスで価値を活気しようとしているデータサイエンティストは学んでおきたい講座です。
2015Amazon3冊連続1位!カール教授の「ビジネスモデル構築」【まとめパック】
まとめ:データサイエンティストになるには今からでも遅くない
データサイエンティストの定義は様々です。
なにも大学院に入り直したり、資格を取得する必要はありません。
今では様々な素晴らしいオンラインコースがネットにあふれており(しかも返金可能で!)、自分に本当に必要なことだけを学べる時代です。
データサイエンティストになって何を達成したいかをよく考え、必要なスキルを身に着けていきましょう。