ランサーズ(Lancers)エンジニアブログ > Python > ランサーズの仕事を機械学習で分類する – 1. 概要 –

ランサーズの仕事を機械学習で分類する – 1. 概要 –

s.t|2017年07月10日
Python

ランサーズは、企業などが仕事を依頼し、フリーランサーが自分に合った仕事を選ぶのを手助けするプラットフォームです。
ランサーズでは、依頼された仕事を8つのカテゴリのいづれかに属するように分類しています。依頼された仕事のタイトルからどのカテゴリに属するかを機械学習を使って予測します。つまり、機械学習における分類問題を解きます。

全5回に分けて仕事の分類を実装します。使用言語はPythonです。

  1. 概要
  2. 分かち書き
  3. 特徴化(Coming soon)
  4. 学習(Coming soon)
  5. 予測(Coming soon)

Python 3.6のインストール方法

MacやUbuntuはpython2系が標準で使用される状態になっているので、最新の3系を使えるようにします。
Anacondaという名前のPython本体と機械学習関連のパッケージを管理するためのツールを使用します。ニシキヘビ(Python)よりも強者であるアナコンダ(Anaconda)という位置付けが名前の由来。

ホームディレクトリにAnacondaをインストールし、ターミナルでpythonと打つと、AnacondaのPython3が使用されるようにします。

  • macOS Sierraの場合
    wgetがインストールされていない場合は Homebrew を使ってインストールしてください。Homebrewがインストールされていない場合はHomebrewをインストールしてください。
brew install wget
wget https://repo.continuum.io/archive/Anaconda3-4.4.0-Linux-x86_64.sh
bash ~/Anaconda3-4.4.0-Linux-x86_64.sh -b -p ~/anaconda
export PATH=~/anaconda/bin:$PATH
echo export PATH="~/anaconda/bin:$PATH" >> ~/.bash_profile
  • Ubuntu 16.04の場合
wget https://repo.continuum.io/archive/Anaconda3-4.4.0-Linux-x86_64.sh
bash ~/Anaconda3-4.4.0-Linux-x86_64.sh -b -p ~/anaconda
export PATH=~/anaconda/bin:$PATH
echo export PATH="~/anaconda/bin:$PATH" >> ~/.profile

ターミナルでpythonと入力して下記のように表示されれば正常にインストールできています。python2系が表示される場合は、一度ターミナルを閉じて、再度 python を実行してみてください。

mac:~ lancers$ python
Python 3.6.0 |Anaconda 4.3.1 (x86_64)| (default, Dec 23 2016, 13:19:00)
[GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.57)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>>

以上でPython3の準備が整いました。

2.分かち書きへ続く

Posted by Shigeomi Takada