phpで禁止ワードチェック機能を実装してみた

適当にプログラム作って勢いでリリースすると、運営を始めてからそういえばこれ無いと運用上不味いよねと後から気づくのが、IPアドレス弾きや禁止ワードチェックの機能。

特に禁止ワードチェックで、この間つい勢いでリリースしてしまって大失敗した。
Feedでのまとめ系のandroidアプリを公開しようと、Googleプレイにデベロッパー登録してアプリをとりあえずβ版としてアップロードしたら、なんと、ものの数分で公開を停止させられた(笑)
停止の理由は、「コンテンツ ポリシーの露骨な性表現を含むコンテンツ条項への違反。」とのこと。

健全なごく普通のアプリであって18禁のいやらしい内容なんて含んだアプリでもないし、その時は訳が分からなくて、なんで削除されてしまうの?間違いじゃない?とメールで抗議してみたら、「性的な表現、または露骨な描写を含むコンテンツやタイトル文があります。」らと指摘されて返信がきた。
改めてFeedで取得してきている記事内容を念入りに確認してみると、色んなサイトからリンクを引っ張ってきているので、中には確かに下劣な広告や文章、画像などあってビックリしたことがある。
こんな短時間で引っかかってアプリを削除されてしまうなんて、そういうのに引っ掛ける検知ツールみたいなのが動いているのだろうか。以前はGoogleプレイは無法地帯な感じだったのに、今はずいぶんと厳しくなったものです。
今年くらいからどうやら人的チェックもするようになってドンドン厳しくなっているようです。これからアプリ作って登録する方は、GoogleプレイでもApple並に気を付けてから登録するようにしましょう。

それはそうと、このままアプリ公開を断念するのもすごく悔しいし、デベロッパー登録に25ドル先払いしてしまっているので、なんとかしたい。
PHPで禁止ワードにひっかかる記事はアプリに表示させないようになんとかしました。

禁止ワードチェック機能

例えば、RSSで取得した記事のタイトルを禁止ワードチェックする場合は以下の手順になります。

まず、禁止ワードを設定するiniファイルを ngword.ini のファイル名で以下のような感じでNG_WORDSと、そのNGワードを包括してしまう用語をOK_WORDSとして作成します。

01[NG_WORDS]
021 = "ロリ"
032 = "エロ"
043 = "えろ"
054 = "フェラ"
065 = "グロ"
07 
08[OK_WORDS]
091 = "ペロリ"
102 = "イエロー"
113 = "教えろ"
124 = "カフェラテ"
135 = "フェラーリ"
146 = "グローブ"

iniファイルを作ったら、PHP内で禁止ワードをパースして読み込み、チェック機能を以下のような感じで追加します。

01// 禁止ワード設定ファイルをパース
02$code = parse_ini_file('ngword.ini', true);
03$ng_words = $code['NG_WORDS'];
04$ok_words = $code['OK_WORDS'];
05 
06foreach($rssdata->item as $myEntry){
07  // 禁止ワードチェックフラグを0にセット
08  $ngflag = 0;
09 
10  // タイトル変数を一旦$title_tempへ
11  $title_temp = $myEntry->title;
12 
13  // 文字列を一旦小文字にする
14  $title_temp = mb_strtolower($title_temp, 'utf-8');
15 
16  // 文字列内の半角カナ、濁点付きの文字、全角英数字、全角スペースを変換
17  $title_temp = mb_convert_kana($title_temp,'asVK','utf-8');
18 
19  // 空白スペースや、。を一旦削除
20  $title_temp = preg_replace('/\s|、|。/', '', $title_temp);
21 
22  // 禁止キーワードを包括してしまう許可キーワードを一旦 * に変換
23  foreach ($ok_words as $okWordsVal) {
24    if (strpos($title_temp, $okWordsVal) !== false) {
25      $title_temp = str_replace($okWordsVal, '*', $title_temp);
26    }
27  }
28 
29  // 禁止ワードチェック
30  foreach ($ng_words as $ngWordsVal) {
31    if (strpos($title_temp, $ngWordsVal) !== false) {
32      // 禁止ワードが見つかった!
33      $ngflag = 1; // フラグに1を入れる
34      break; // 処理の停止
35    }
36  }
37   
38  // 禁止ワードフラグに1が入っていればループ飛ばし
39  if($ngflag == 1) continue;
40   
41  // 以下から正常処理
42  
43  
44  
45   
46}

以上