# Python プログラミング基礎 その２

（その１からの続き）

## このNotenbookの内容

- 関数・クラスの利用
    1. 関数の定義 `def`
    1. クラスの定義 `class`

- ファイル入出力とライブラリの利用
    1. テキスト（文字列）形式でのファイル読み込み `open`, `close`
    1. ライブラリの読み込み `import`, `as`, `from`
    1. 外部ライブラリの管理 `pip`

- 乱数の生成と乱数の固定
    1. 乱数の利用 `random`
    1. 乱数の固定

    

---

# 関数・クラスの利用

特定の処理を繰り返し使用する場合、**関数**や**クラス**を使用してコードを整理します。  

可読性とメンテナンス性が向上し、適切な変数管理によってメモリ使用を効率化することができます。  
一方でコードが複雑になり、特に共同開発の場合は仕様設計の管理が重要となります。  
開発の話になるので、詳しくは「モジュール設計」「UML(Unified Modeling Language)」で調べてください。

---
## １．関数の定義（`def`）

複数行のコードを関数としてまとめることができます。  

> **`def`文**  
> 任意の<u>関数名</u>と<u>部分プログラム</u> からなる。  
> 関数で使用する変数を<u>**引数**</u>として受け取り、計算結果を<u>**戻り値**</u>（返り値）で戻す。  

In [None]:
# 引数 x を2倍して絶対値を返す関数 two_times を定義する
def two_times(hikisu): # 引数は1つで関数内の変数名は hikisu_1 としている
    return 2*hikisu # return で hikisu を2倍して戻す

↑を実行すると定義した関数を利用できるようになります。  

In [None]:
# 上で定義した関数に変数を与えて結果を表示。
print(two_times(100))

# 定義した関数は何度でも使用可能。
print(two_times(-5))

# 関数を変数に入れることもできる
a = two_times
print(a(20))

関数内で使用した変数名は、関数内でのみ使用されます。
詳しくは「変数のスコープ」で調べてください。

In [None]:
# 変数名 hikisu は上記の関数内で定義して使用しているが、このnotebook本体のスコープで定義していないためエラーが出る。
print(hikisu)

In [None]:
# pythonの場合は変数名が被っても問題ない。
hikisu = 100
print(two_times(20), hikisu)

複数の引数を指定したり、引数の初期値（入力されなかった場合の値）を指定できます。

In [None]:
# 引数なし、常に整数型の2を戻す関数
def CONSTANT_TWO():
  return int(2)

# 2つの引数の平均を戻す関数、bが入力されなかった場合はb=5を使用
def mean_calcurator(a, b=5):
  sum = a + b
  return sum/2

# リストの総和と平均を表示し、それぞれを戻す関数
def sum_and_mean_of_list(a):
    #総和の計算
    sum_of_list = 0
    for i in a:
      sum_of_list += i
    print("総和は", sum_of_list)

    #平均の計算
    length_of_list = len(a)
    mean_of_list = sum_of_list / length_of_list
    print("平均は", mean_of_list)

    return sum_of_list, mean_of_list # 戻り値は2つ

In [None]:
print(CONSTANT_TWO())

print(mean_calcurator(200,500))
print(mean_calcurator(3))

print(sum_and_mean_of_list([200, 500, 200, 100]))


---
## ２．クラスの定義（`class`）

>**`class`文**  
>任意の<u>クラス名</u>と<u>複数の関数</u> からなる。  
>クラスを呼び出した際に実行する**__init__関数**を定義する必要がある。  
>__init__関数ではクラスの初期設定などを行う。


In [None]:
# クラス Test を作成する
class Test(): #クラス名 Test

    #クラス内部の初期設定。ここではクラス内の関数で使える3つの変数 hensu1, hensu2, sum1to2 を設定。
    def __init__(self,a,b):
        self.hensu1 = a
        self.hensu2 = b
        self.sum1to2 = a+b
        print((a,b),"でクラスを設定しました。 ")

    #クラス内の変数を参照して動作する関数
    def testn(self):
        print("{0}+{1}={2}".format(self.hensu1, self.hensu2, self.sum1to2))
        return

In [None]:
# 上で定義した Test クラスを変数に格納（クラスオブジェクトを作成）。
a = Test(1,2)

print("---")

# testn関数を実行
a.testn()

print("---")

# クラス内のself.hensu2を表示
a.hensu2

In [None]:
# 別の値で Test クラスオブジェクトを作成。
b = Test(5,6)

In [None]:
# クラスオブジェクト a と b が別の変数を持つ Test クラスオブジェクトになっている。
print(a.hensu1, b.hensu1)

---

# ファイル入出力とライブラリの利用

プログラムによってファイルの読み書きができる。  
ファイル操作はプログラム実行中のフォルダ(current directory)で行われる。  

1. テキスト（文字列）形式でのファイル読み込み `open`, `close`
1. ライブラリの読み込み `import`, `as`, `from`
1. 外部ライブラリの管理 `pip`

In [None]:
# pythonのプログラム内で情報を取得するコード。
import os

print("実行中のフォルダ：",os.getcwd())
print("フォルダ内のファイル・フォルダ：",os.listdir())

---
## １．テキスト形式でのファイル読み書き (`open`, `close`)

>**`open`文**  
>指定したファイルを読み書きできる状態にする。  
>実際に読み込み/書き込みするためには追加で指示が必要。


In [None]:
# ファイルに書き込むデータ
text = "書き込みと読み込みのテスト \n上手く書き込めますように・・・"

# kakikomi.txt ファイルへ書き込み
with open("./kakikomi.txt", mode="w", encoding="utf-8") as f: # withで定義した変数 f はwith内でだけ有効。
    f.write(text)

os.listdir()

In [None]:
# kakikomi.txt ファイルを読み込んで表示
with open("./kakikomi.txt", mode="r", encoding="utf-8") as f: # withで定義した変数 f はwith内でだけ有効。
    row = f.read()

print(row)


---
## ２．ライブラリの読み込み (`import`, `as`, `from`)

> **`import`文**  
> 別のファイルに記述された関数やクラスを使用できるようにする。  

関数やクラスが記述されたプログラム群やファイルを**ライブラリ**と呼びます。  
汎用的な計算処理から先端研究に至るまで、さまざまなライブラリが存在します。  
プログラムでライブラリを使用する際は初めに宣言することが一般的です。

なお、`print`関数や`open`関数のように`import`で宣言せずとも使用できる関数を標準ライブラリと呼び、   
対比的な表現として、使用に宣言が必要なライブラリを外部ライブラリと呼びます。  


洗練されたライブラリを効率的に活用することで、誤植や無駄な処理をなくし、  
また、可読性、拡張性、互換性、環境の同期、そしてプログラミングの作業効率を向上することができます。  

### numpyライブラリ

https://numpy.org/doc/

`numpy`ライブラリは数理計算処理プログラムをまとめたライブラリです。  
比較的処理が速く行列計算が可能。数理計算で広く使用されている。

ライブラリの読み込みは`import`を使用する。  
読み込んだライブラリはclassまたは関数のように使用できる。  

In [None]:
# numpyライブラリを読み込む。
import numpy

In [None]:
# numpyライブラリのarray関数でリスト配列をnumpy独自のarray配列（行列）に変換して 変数 a に格納。
a = numpy.array([[1,2],[2,1]])

print(type(a) ,"\n", a)

`list`配列は数理的な行列演算に対応していませんが、`numpy.array`配列は行列演算に対応しています。  
（具体的な演算のプログラムはnumpyライブラリに入っています。）

In [None]:
print("加法")
display(a+a)

print("アダマール積（要素ごとの積）")
display(a*a)

print("行列の積")
display(a@a)

In [None]:
#行列の要素の総和
display(a.sum())

#行列の要素の平均
display(a.mean())

#行列の固有ベクトルと固有値
display(numpy.linalg.eig(a)) #numpyライブラリのlinalgクラスのeig関数に行列 a を渡す

ライブラリを読み込む際に`as`で変数名をあてることができます。  
頻繁に使用するライブラリは短縮した名前を付けておくと効率が良いです。

In [None]:
#numpyライブラリを読み込んで np と名付ける。
import numpy as np

In [None]:
a = np.array([[1,2],[2,1]]) # npでよい
print(a, type(a))

### 演習：ライブラリの読み込み
次のセルは`pandas` ライブラリを読み込み `pd` と名付けた場合に正しく実行されます。
1. そのまま実行し、エラー文を確認してください。
1. セルの1行目にライブラリを読み込む命令を追加し実行してください。

In [None]:
# pandasライブラリを読み込み pd と名付ける
# import ...

#pandasライブラリを使用してデータ表を作成
df = pd.DataFrame([[88, "新潟"], [10001511, "秋田"], [7600, "山形"]], columns=["指標", "所属"])

#作成したデータ表を表示
display(df)

In [None]:
# ファイルにプログラムを書き込み
text = "print('（初回だけ表示）hello world!') \ndef hello(): \n  print('（関数で表示）hello!')"

'''↓textの中身↓
print('（初回だけ表示）hello world!')
def hello():
    print('（関数で表示）hello!')
'''


# hello.py ファイルへ書き込み
with open("./hello.py", mode="w", encoding="utf-8") as f: # withで定義した変数 f はwith内でだけ有効。
    f.write(text)

os.listdir()

In [None]:
# ↑で作った hello.pyをimport
import hello

# helloライブラリの hello関数を実行
hello.hello()

#次の2行で再読み込みができる。読み込み時のみ実行されるprint表示を見たい場合
# import importlib
# importlib.reload(hello)

---
## ３．ライブラリの管理 (`pip`コマンド)

ライブラリの相互参照や、更新管理を行うための`pip`コマンドがある。  
このコマンドはプログラム内の処理ではなく、pythonのプログラミング環境の処理であるため、プログラム内で実行するものではない。  
`pip`コマンドはPCの大本のコンソールで実行する。

Jupyter Notebookではコードの先頭に`!`をつけるとコンソール上でコマンドを実行する。

In [None]:
# コンソールで pip を実行。list でダウンロード済のライブラリとバージョンを表示する。
!pip list

# ↓実行結果がNotebookに表示される。

ライブラリは、上の演習で見たように自作できます。
`numpy`や`pandas`以外にもライブラリは作られた数だけ存在しています。  
使用するライブラリを使用するときだけ読み込むようにしましょう。  

また、公開されている有名ライブラリは使い方のドキュメントも公開しています。  
多機能なライブラリはドキュメントも膨大です。  
自身が使用する機能の説明だけでも読んでおくとよいです。    

### ライブラリの例
- 行列計算関係 `numpy` https://numpy.org/doc/
- データベース処理 `pandas` https://pandas.pydata.org/docs/
- csvデータ入出力 `csv` https://docs.python.org/ja/3/library/csv.html
- 可視化 `seaborn` https://seaborn.pydata.org/
- 機械学習 `sklearn` https://scikit-learn.org/stable/

ライブラリが他のライブラリを使用している**依存関係**がある場合、バージョンアップによって過去作成したプログラムが動作しなくなる場合があります。  
厳密にはvenvなどの環境設定と合わせてプログラムを作成することが望ましいです。

### (Colaboratory向け)
Google colaboratoryは独自仕様をもつため、特に環境にかかる挙動でわからないときはColaboratoryのドキュメントを参照します。  
フリーの環境のほとんどは起動するたびに環境がリセットされます。

In [None]:
# ライブラリリストをmecabでフィルタ。たぶん何も表示されない。
!pip list | grep mecab

In [None]:
# mecab-pythonライブラリとunidic-liteライブラリをインストールする。notebookを閉じるとインストール歴は消える。
# !pip install mecab-python3
# !pip install unidic-lite

In [None]:
# mecab-python3ライブラリをimport。ライブラリ名と読み込みファイル名が一致しない場合もある。
import MeCab

# MeCabライブラリのTaggerクラスのparse関数で文字列を形態素解析
print(MeCab.Tagger().parse("すもももももももものうち"))

---

# 乱数の生成と乱数の固定

1. プログラミングにおける乱数とは
1. 乱数の利用 `random`
1. 乱数の固定


---
## １．乱数の利用

プログラムは書かれたコードの通りに処理を実行し、原則として毎回同じ結果を返します。  

このとき、日付などの環境情報を参照することで、実行するたびに結果が異なるプログラムを作成できます。

プログラムで無作為性を表現したい場合、**乱数**と呼ばれる無作為数列を使用すします。  
ただし、"プログラムは毎回書かれたとおりに同じ処理を実行し、決まった結果を返す"
という性質から、プログラム上では完全な無作為性は実現できません。
そのため、プログラム上の乱数は理論上の乱数と区別して**疑似乱数**と呼ばれます。

Pythonでは `random` ライブラリを使用して0以上1未満で無作為な数値を生成できます。  
なお、ほとんどのプログラムで[メルセンヌツイスタ](https://docs.python.org/ja/3/library/random.html)と呼ばれる長周期かつ一様性をもつ関数を用いた疑似乱数生成アルゴリズムが採用されており、プログラム上の無作為性は実務上にも十分な無作為性があるとされています。

In [None]:
import random

#実行するたびに表示が変わる　[Ctrl]+[Enter]で実行
print(random.random())

In [None]:
ransu = random.random() # ここで乱数値を取得
print(ransu)

#1/5でグー、2/5でチョキ、2/5でパーが表示される
if ransu < 1/5:
  print("グー")
elif ransu < 3/5:
  print("チョキ")
else:
  print("パー")


#### 演習：乱数
次のコードを実行し、運を試してみてください。  
また、ガチャ1回のミスティックレアの出現確率が$0.5\%$になるよう修正してください。

In [None]:
# 10回目はスーパーレア以上確定！10連ガチャ！！！
for i in range(10):
  if random.random() > 0.5 and i != 9:
    print("レア！")
  else:
    if random.random() > 0.05:
      print("スーパーレア！！")
    elif random.random() > 0.005:
      print("***ウルトラレア！！！***")
    else:
      print("ミスティックレア！！！！！！！うおおおおおおおおおおおおおおおおお！")

---
## ２．乱数の固定

プログラムコードの重要な性質として**再現性**があります。  
再現性とは、同じ状況であればだれが実行しても同じ結果が得られる性質です。

研究やシミュレーションでは無作為性と再現性を両立する必要があるため、  
疑似乱数の生成結果を固定して利用することが一般的です。  
疑似乱数は**seed値**をもとに決まった順で結果が生成されるため、seed値を指定することで無作為を再現できるようになります。

In [None]:
# ↓ミスティックレアが出るseed値
random.seed(711)
for i in range(10):
  if random.random() > 0.4 and i != 9:
    print("レア！")
  else:
    if random.random() > 0.05:
      print("スーパーレア！！")
    elif random.random() > 0.005:
      print("***ウルトラレア！！！***")
    else:
      print("ミスティックレア！！！！！！！うおおおおおおおおおおおおおおおおお！")

### 演習：whileによる探索
ガチャが当たるseed値を、`while`文によるループで探索して特定してください。

ヒント：int型に変換すると小数部分は切り捨てられる。

In [None]:
import random
cheet_seed = 0
random.seed(cheet_seed)
ransu = random.random()

# while文で探索してみる
while ransu > 0.005:
    cheet_seed += 1
    random.seed(cheet_seed)
    ransu = random.random()


random.seed(cheet_seed)
ransu = random.random()
print("seed値：", cheet_seed)
print("乱数値：", ransu)
if ransu <= 0.005:
    print("ミスティックレア！！！！！！！うおおおおおおおおおおおおおおおおお！")
else:
    print("はずれ")

In [None]:
random.seed(139)
random.random()