ランサーズ等のサービスを開発・運用する中で得た知識やノウハウを紹介しています。

sklearnの記事一覧

thumbnail

Labels:  Python, 機械学習 投稿者:s.t

サンプルデータを使ってリアルタイムレコメンデーションを作る – 3. Webアプリケーションとしての実装 –

サンプルデータを使ってリアルタイムレコメンデーションを作る – 3. Webアプリケーションとしての実装 – はじめに 参考書 レコメンドとは データセット 特徴エンジニアリング 類似度計算 TF-IDF 次元圧縮 コサイン類似度 バイ …

thumbnail

Labels:  機械学習 投稿者:s.t

サンプルデータを使ってリアルタイムレコメンデーションを作る – 2. 類似度計算 –

サンプルデータを使ってリアルタイムレコメンデーションを作る – 2. 類似度計算 – はじめに 参考書 レコメンドとは データセット 特徴エンジニアリング 類似度計算 TF-IDF 次元圧縮 コサイン類似度 バイナリデータ Webアプリ …

thumbnail

Labels:  機械学習 投稿者:s.t

サンプルデータを使ってリアルタイムレコメンデーションを作る – 1. はじめに –

サンプルデータを使ってリアルタイムレコメンデーションを作る – 1. はじめに – はじめに 参考資料 レコメンドとは データセット 特徴エンジニアリング 類似度計算 TF-IDF 次元圧縮 コサイン類似度 バイナリデータ Webアプリ …

thumbnail

Labels:  DevOps 投稿者:s.t

ランサーズの仕事を機械学習で分類する – 2. 分かち書き –

分かち書きとは 分かち書きとは、テキストを空白区切りにしたものです。 テキストを機械学習させるには前段階としてテキストを分かち書き状態にする必要があります。 なんで休みなく働いている人が偉いの? このテキストの分かち書き状態は下記の通りです。単語の意味ごとに空 …