SlideShare a Scribd company logo
1 of 30
Download to read offline
1 
Log解析の基礎 
@phpcon2014 菊池佑太
2 
One to One
3 
機械学習
知識無くておk 
まずやってみる! 
4
5 
性別推定
6 
未知への拡張 
50% 
20% 20%
7 
検索Log
機械に確率を学習 
P(男|ガンダム) = 0.8 
8
9 
<?php 
namespace Algorithms; 
class NaiveBayes { 
public function add_instance(){} 
public function train(){} 
public function predict(){} 
... 
}
10 
学習 
推定 
評価
{ 正解 : {KW : 回数} } 
{ 男性 : {ガンダム : 5 , ACミラン : 8 } } 
{ 女性 : {化粧水 : 2 , 日焼け止め : 7 } } 
11 
・・・
12 
$nb = new NaiveBayes(); 
// iteration 
$nb->add_instance( 'label' => '正解', 
'attributes' => 'KW : 回数' ); 
$nb->train();
13 
学習 
推定 
評価
{ 未知 : {KW : 回数} } 
{ ? : {ガンダム : 3 , シャア : 2 } } 
14 
・・・
15 
// iteration 
$res = $nb->predict( 'attributes' => 'KW : 
回数' ); 
foreach($res as $label => $p) { 
echo $label . "t" . $p . "n"; 
} 
// 男性 : 0.878 
// 女性 : 0.122 
// UniqIDをKeyにNosqlへ
16 
学習 
推定 
評価
17 
精度 
Balance 
{ 精度 : 70%, 拡張量: 30%増} 
拡張量
18 
応用
Hadoop Streaming 
19 
PHP
20 
特徴を追加して 
精度を上げる
21 
他の問題
Are You Ready? 
22
魔法少 女推定23
24 
言語・画像処理から人物推定 
・動画台詞抽出 
{ KW : 回数} 
・動画SnapShot 
{特徴 : 数値}
25 
学習 
推定 
評価(精度)
26 
台詞 40% 
画像 低精度
もっと詳しく知り 
27 
たい方 
〜知りたい,があなたを変えていく〜
28 
僕の名前 まどマギ 
検索! 
〜知りたい,があなたを変えていく〜
29 
Check It Out
30 
ご清聴 
ありがとうござい 
ました

More Related Content

Viewers also liked

中年以降エンジニアの成長戦略
中年以降エンジニアの成長戦略中年以降エンジニアの成長戦略
中年以降エンジニアの成長戦略Ryo Tomidokoro
 
Good Parts of PHP and the UNIX Philosophy
Good Parts of PHP and the UNIX PhilosophyGood Parts of PHP and the UNIX Philosophy
Good Parts of PHP and the UNIX PhilosophyYuya Takeyama
 
恐怖!シェルショッカーの POSIX原理主義シェルスクリプト
恐怖!シェルショッカーの POSIX原理主義シェルスクリプト恐怖!シェルショッカーの POSIX原理主義シェルスクリプト
恐怖!シェルショッカーの POSIX原理主義シェルスクリプトRichie Shellshoccar
 
GNU awk (gawk) を用いた Apache ログ解析方法
GNU awk (gawk) を用いた Apache ログ解析方法GNU awk (gawk) を用いた Apache ログ解析方法
GNU awk (gawk) を用いた Apache ログ解析方法博文 斉藤
 
Amebaサービスのログ解析基盤
Amebaサービスのログ解析基盤Amebaサービスのログ解析基盤
Amebaサービスのログ解析基盤Toshihiro Suzuki
 
PHP+伺かで始める新しい通知の形
PHP+伺かで始める新しい通知の形PHP+伺かで始める新しい通知の形
PHP+伺かで始める新しい通知の形K Kinzal
 
POSIX中心主義と情報科学教育
POSIX中心主義と情報科学教育POSIX中心主義と情報科学教育
POSIX中心主義と情報科学教育Tomoyuki Matsuura
 
サーバ攻撃されてみた
サーバ攻撃されてみたサーバ攻撃されてみた
サーバ攻撃されてみたKimie Furuya
 
Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析shuichi iida
 
Flumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システムFlumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システムSatoshi Iijima
 

Viewers also liked (10)

中年以降エンジニアの成長戦略
中年以降エンジニアの成長戦略中年以降エンジニアの成長戦略
中年以降エンジニアの成長戦略
 
Good Parts of PHP and the UNIX Philosophy
Good Parts of PHP and the UNIX PhilosophyGood Parts of PHP and the UNIX Philosophy
Good Parts of PHP and the UNIX Philosophy
 
恐怖!シェルショッカーの POSIX原理主義シェルスクリプト
恐怖!シェルショッカーの POSIX原理主義シェルスクリプト恐怖!シェルショッカーの POSIX原理主義シェルスクリプト
恐怖!シェルショッカーの POSIX原理主義シェルスクリプト
 
GNU awk (gawk) を用いた Apache ログ解析方法
GNU awk (gawk) を用いた Apache ログ解析方法GNU awk (gawk) を用いた Apache ログ解析方法
GNU awk (gawk) を用いた Apache ログ解析方法
 
Amebaサービスのログ解析基盤
Amebaサービスのログ解析基盤Amebaサービスのログ解析基盤
Amebaサービスのログ解析基盤
 
PHP+伺かで始める新しい通知の形
PHP+伺かで始める新しい通知の形PHP+伺かで始める新しい通知の形
PHP+伺かで始める新しい通知の形
 
POSIX中心主義と情報科学教育
POSIX中心主義と情報科学教育POSIX中心主義と情報科学教育
POSIX中心主義と情報科学教育
 
サーバ攻撃されてみた
サーバ攻撃されてみたサーバ攻撃されてみた
サーバ攻撃されてみた
 
Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析
 
Flumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システムFlumeを活用したAmebaにおける大規模ログ収集システム
Flumeを活用したAmebaにおける大規模ログ収集システム
 

Log解析の基礎@phpcon2014