---
# 画像認識を試してみよう！

参考：[山梨学院大学, 機械学習実験(1) -顔認識とモザイク](https://colab.research.google.com/drive/12VoBf1ffuDTbIx_j8iamw2BGMJx3igTh?usp=sharing#scrollTo=hS4v8tb71TNw)

`Shift` + `Enter` で実行してみよう！

In [None]:
#ライブラリの読み込み
%matplotlib inline
import matplotlib.pyplot as plt # グラフの描画を扱う標準ライブラリ.
import urllib.request as req # urlを扱うための標準ライブラリ.
import cv2 # OpenCV for python. Intelが提供している画像処理ライブラリ.

# カスケードファイル（画像判別器のもと）をダウンロードする
url = "https://raw.githubusercontent.com/opencv/opencv/master/data/haarcascades/haarcascade_frontalface_alt.xml"
save_path = "haarcascade_frontalface_alt.xml"
req.urlretrieve(url, save_path)


# カスケードファイルから顔の検出器を作成する
cascade = cv2.CascadeClassifier("haarcascade_frontalface_alt.xml")

In [None]:
# ネットからサンプル画像をダウンロードする
filename = "niigata-univ.png"
req.urlretrieve("https://www.niigata-u.ac.jp/wp-content/uploads/2021/06/slide_2-4-1.jpg", filename)

# ダウンロードした画像を表示する
img = cv2.imread(filename)
plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
plt.show()

In [None]:
# サンプル画像をグレイスケールに変換してから顔を検出する
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
face_list = cascade.detectMultiScale(img_gray, minSize=(30,30))

# 可視化処理
if len(face_list) == 0:
    # 顔が見つからなかった
    print("失敗しました")
else:
    # 顔が見つかったら、その周囲を赤く囲むように画像を修正する
    img_mark = img.copy()
    for (x,y,w,h) in face_list:
        print("x座標,y座標,幅,高さ=", x, y, w, h)
        red = (0, 0, 255)
        cv2.rectangle(img_mark, (x, y), (x+w, y+h), red, thickness=3)
    # 修正した画像を表示する
    cv2.imwrite("face-detect.png", img_mark)
    plt.imshow(cv2.cvtColor(img_mark, cv2.COLOR_BGR2RGB))
    plt.axis("off")
    plt.show()

In [None]:
# 画像の指定の位置にモザイクをかける関数
def mosaic(img, rect, size):
    (x1, y1, x2, y2) = rect
    w = x2 - x1
    h = y2 - y1
    i_rect = img[y1:y2, x1:x2]
    i_small = cv2.resize(i_rect, ( size, size))
    i_mos = cv2.resize(i_small, (w, h), interpolation=cv2.INTER_AREA)
    img2 = img.copy()
    img2[y1:y2, x1:x2] = i_mos
    return img2

img_mozaic = img.copy()

# 顔として認識した部分にモザイク処理を施す
for (x,y,w,h) in face_list:
    img_mozaic = mosaic(img_mozaic,(x,y,x+w,y+h),10)

# モザイク処理した画像を表示する
cv2.imwrite("face-detect.png", img_mozaic)
plt.imshow(cv2.cvtColor(img_mozaic, cv2.COLOR_BGR2RGB))
plt.axis("off")
plt.show()

上のプログラムの挙動は次の通りです。

1. 顔検出器を用意する。
1. 画像を用意する
1. 検出器で顔の位置を検出する。  
1. 検出した顔の位置に赤い四角を書き込んで表示する。
1. 検出した顔の位置の情報を10*10に圧縮して上書きして表示する。


検出器の種類を変えたり画像を変えたり、検出後の動作を変えるなどで好きなように画像検出と検出後の処理をカスタマイズできます。

---
---

# AIに作業をお願いしてみよう！

### 以下は 2023.09の講座の記述。2年でこうしたAIcopilotツールも当たり前になりました。


言語モデルAI活用の商用化で話題なのは[Microsoft 365 copilot](https://adoption.microsoft.com/ja-jp/copilot/)

2023/9/5、[The Open Interpreter Project](https://openinterpreter.com/)から、
言語モデルをもとにあらゆるPC操作を実行するAIアプリケーション"Open Interpreter"(prerelease ver.0.1.0)が公開されました。[demo動画](https://github.com/KillianLucas/open-interpreter/#demo)

動画では、
- "Can you set my system to dark mode?"(システムをダークモードに変更できる？)   
$\rightarrow$ macのシステム設定を変更してダークモードに切り替わる
- "Can you convert the word docs here to PDFs?"(ここのワード文書をpdfにできる？)  
$\rightarrow$指定したフォルダ内のワードファイルをpdf化

といった、自然言語的な指示によって汎用的なPC操作を実現しています。  
特定タスクの作業補助を提供するcopilot系を超える汎用性から、9月5日の公開以降、AI技術の開発コミュニティ、研究コミュニティで話題となっています。  
またオープンソースであり誰でも自分のＰＣで利用できることが、データの独占化への懸念や研究利用の観点から歓迎されている理由でもあります。

現状はコンピュータ上のあらゆる操作が可能なことがセキュリティ脆弱性と認識されており詳しい人向けです。今後の動向に注目です。
