##### Copyright 2020 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# TensorFlow Lite Model Maker による BERT 質疑応答

<table class="tfo-notebook-buttons" align="left">
  <td>     <a target="_blank" href="https://www.tensorflow.org/lite/tutorials/model_maker_question_answer"><img src="https://www.tensorflow.org/images/tf_logo_32px.png">TensorFlow.org で表示</a>   </td>
  <td>     <a target="_blank" href="https://colab.research.google.com/github/tensorflow/docs-l10n/blob/master/site/ja/lite/tutorials/model_maker_question_answer.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png">Google Colab で実行</a>   </td>
  <td>     <a target="_blank" href="https://github.com/tensorflow/docs-l10n/blob/master/site/ja/lite/tutorials/model_maker_question_answer.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png">GitHub でソースを表示</a>   </td>
  <td>     <a href="https://storage.googleapis.com/tensorflow_docs/docs-l10n/site/ja/lite/tutorials/model_maker_question_answer.ipynb"><img src="https://www.tensorflow.org/images/download_logo_32px.png">ノートブックをダウンロード</a>   </td>
</table>

[TensorFlow Lite Model Maker ライブラリ](https://www.tensorflow.org/lite/guide/model_maker)は、TensorFlow モデルを適合し、オンデバイス ML アプリケーションにこのモデルをデプロイする際に特定の入力データに変換するプロセスを単純化します。

このノートブックでは、Model Maker ライブラリを使用したエンドツーエンドの例を示し、質疑応答タスクで一般的に使用される質疑応答モデルの適合と変換を説明します。

# BERT 質疑応答タスクの基礎

このライブラリでサポートされているタスクは、抽出型の質疑応答タスクです。特定の文章と質問に対する回答が文章に含まれていることになります。以下の画像は、質疑応答の例を示します。

<p align="center"><img src="https://storage.googleapis.com/download.tensorflow.org/models/tflite/screenshots/model_maker_squad_showcase.png"></p>

<p align="center">
    <em>回答は文章に含まれている（画像提供: <a href="https://rajpurkar.github.io/mlx/qa-and-squad/">SQuAD ブログ</a>）</em>
</p>

質疑応答タスクのモデルでは、入力は、すでに前処理されている文章と質問のペアで、出力は、文章の各トークンの開始ロジットと終了ロジットです。入力のサイズは設定可能で、文章と質問の長さに応じて調整することができます。

## エンドツーエンドの概要


次のコードスニペットでは、数行のコード内でモデルを取得する方法を示します。全体的なプロセスには、（1）モデルの選択、（2）データの読み込み、（3）モデルの再トレーニング、（4）評価、（5）TensorFlow Lite 形式へのエクスポート、という 5 つのステップが含まれます。

```python
# Chooses a model specification that represents the model.
spec = model_spec.get('mobilebert_qa')

# Gets the training data and validation data.
train_data = DataLoader.from_squad(train_data_path, spec, is_training=True)
validation_data = DataLoader.from_squad(validation_data_path, spec, is_training=False)

# Fine-tunes the model.
model = question_answer.create(train_data, model_spec=spec)

# Gets the evaluation result.
metric = model.evaluate(validation_data)

# Exports the model to the TensorFlow Lite format with metadata in the export directory.
model.export(export_dir)
```

上記のコードについて、次のセクションでより詳しく説明します。

## 前提条件

この例を実行するには、[GitHub リポジトリ](https://github.com/tensorflow/examples/tree/master/tensorflow_examples/lite/model_maker) から、Model Maker パッケージを含む必要なパッケージをインストールする必要があります。

In [None]:
!pip install -q tflite-model-maker

必要なパッケージをインポートします。

In [None]:
import numpy as np
import os

import tensorflow as tf
assert tf.__version__.startswith('2')

from tflite_model_maker import model_spec
from tflite_model_maker import question_answer
from tflite_model_maker.config import ExportFormat
from tflite_model_maker.question_answer import DataLoader

「エンドツーエンドの概要」では、簡単なエンドツーエンドの例を実演しています。次のセクションでは、順を追ってより詳しく例を説明します。

## 質疑応答のモデルを表現する model_spec を選択する

各 `model_spec` オブジェクトは、質疑応答用の特定のモデルを表現します。Model Maker は現在、MobileBERT と BERT ベースモデルをサポートしています。

サポートされているモデル | model_spec の名前 | モデルの説明
--- | --- | ---
[MobileBERT](https://arxiv.org/pdf/2004.02984.pdf) | 'mobilebert_qa' | BERT ベースより 4.3 倍小さく、5.5 倍高速ですが、オンデバイスシナリオに適した、優位性のある結果を達成します。
[MobileBERT-SQuAD](https://arxiv.org/pdf/2004.02984.pdf) | 'mobilebert_qa_squad' | MobileBERT モデルと同じモデルアーキテクチャを持ち、最初のモデルは [SQuAD1.1](https://rajpurkar.github.io/SQuAD-explorer/) で再トレーニング済みです。
[BERT-Base](https://arxiv.org/pdf/1810.04805.pdf) | 'bert_qa' | NLP タスクで広く使用される標準的な BERT モデルです。

このチュートリアルでは、例として [MobileBERT-SQuAD](https://arxiv.org/pdf/2004.02984.pdf) を使用します。モデルは [SQuAD1.1](https://rajpurkar.github.io/SQuAD-explorer/) で再トレーニング済みであるため、質疑応答タスクではより高速に収束する可能性があります。


In [None]:
spec = model_spec.get('mobilebert_qa_squad')

## オンデバイス ML アプリ固有の入力データを読み込み、データを前処理する

[TriviaQA](https://nlp.cs.washington.edu/triviaqa/) は、読解問題のデータセットで、質問、回答、エビデンスの 3 つを 1 組とした 65 万個を超えるデータが含まれます。このチュートリアルでは、このデータセットのサブセットを使用して、Model Maker ライブラリの使用方法を学習します。

データを読み込むには、`--sample_size=8000` とした[コンバータ用 Python スクリプト](https://github.com/mandarjoshi90/triviaqa#miscellaneous)と一連の `web` データを実行して、TriviaQA データセットを [SQuAD1.1](https://rajpurkar.github.io/SQuAD-explorer/) 形式に変換します。次のようにして、変換コードを少し変更してください。

- 文脈ドキュメントで回答が見つからなかったサンプルを省略します。
- 大文字や小文字を無視し、文脈の元の解答を取得します。

変換済みデータセットのアーカイブバージョンをダウンロードします。

In [None]:
train_data_path = tf.keras.utils.get_file(
    fname='triviaqa-web-train-8000.json',
    origin='https://storage.googleapis.com/download.tensorflow.org/models/tflite/dataset/triviaqa-web-train-8000.json')
validation_data_path = tf.keras.utils.get_file(
    fname='triviaqa-verified-web-dev.json',
    origin='https://storage.googleapis.com/download.tensorflow.org/models/tflite/dataset/triviaqa-verified-web-dev.json')

また、独自のデータセットを使用しても、MobileBERT モデルをトレーニングできます。Colab でこのノートブックを実行している場合は、左のサイドバーを使ってデータをアップロードしてください。

 <img src="https://storage.googleapis.com/download.tensorflow.org/models/tflite/screenshots/model_maker_question_answer.png" alt="Upload File">

データをクラウドにアップロードしない場合は、[ガイド](https://github.com/tensorflow/examples/tree/master/tensorflow_examples/lite/model_maker)に従ってオフラインでライブラリを実行することもできます。

`DataLoader.from_squad` メソッドを使用して、[SQuAD 形式](https://rajpurkar.github.io/SQuAD-explorer/)データを読み込み、特定の `model_spec` に従って前処理します。SQuAD2.0 または SQuAD1.1 のいずれかの形式を使用できます。パラメータ `version_2_with_negative` を `True` に設定すると、形式は SQuAD2.0 となり、そうでない場合は SQuAD1.1 となります。デフォルトでは、`version_2_with_negative` は `False` に設定されています。

In [None]:
train_data = DataLoader.from_squad(train_data_path, spec, is_training=True)
validation_data = DataLoader.from_squad(validation_data_path, spec, is_training=False)

## TensorFlow モデルをカスタマイズする

読み込んだデータに基づいて、カスタムの質疑応答モデルを作成します。`create` 関数は次のステップで構成されています。

1. `model_spec` に基づいて質疑応答のモデルを作成します。
2. 質疑応答モデルをトレーニングします。デフォルトのエポックとデフォルトのバッチサイズは、`default_training_epochs` と `default_batch_size` の 2 つの変数に従って `model_spec` オブジェクトに設定されています。

In [None]:
model = question_answer.create(train_data, model_spec=spec)

モデル構造を詳しく確認します。

In [None]:
model.summary()

## カスタマイズ済みのモデルを評価する

検証データでモデルを評価し、`f1` スコアや `exact match` などを含むメトリクスの dict を取得します。SQuAD1.1 と SQuAD2.0 のメトリクスは異なることに注意してください。

In [None]:
model.evaluate(validation_data)

## TensorFlow Lite モデルをエクスポートする

トレーニングされたモデルを[メタデータ](https://www.tensorflow.org/lite/convert/metadata)で TensorFlow Lite モデル形式に変換し、後でオンデバイス ML アプリケーションで使用できるようにします。語彙ファイルはメタデータに埋め込まれています。デフォルトの TFLite ファイル名は `model.tflite` です。

多くのオンデバイス ML アプリケーションでは、モデルサイズが重要な要因です。そのため、モデルの量子化を適用して小さくし、実行速度を高められるようにすることをお勧めします。デフォルトのポストトレーニング量子化手法は、BERT および MobileBERT モデルのダイナミックレンジ量子化です。

In [None]:
model.export(export_dir='.')

Colab の左サイドバーからダウンロードすることで、[bert_qa](https://github.com/tensorflow/examples/tree/master/lite/examples/bert_qa/android) 参照アプリで [BertQuestionAnswerer API](https://www.tensorflow.org/lite/inference_with_metadata/task_library/bert_question_answerer)（[TensorFlow Lite Task ライブラリ](https://www.tensorflow.org/lite/inference_with_metadata/task_library/overview)）を使って TensorFlow Lite モデルファイルを使用できます。

次のいずれかのエクスポートフォーマットを使用できます。

- `ExportFormat.TFLITE`
- `ExportFormat.VOCAB`
- `ExportFormat.SAVED_MODEL`

デフォルトでは、メタデータとともに TensorFlow Lite モデルをエクスポートするだけです。さまざまなファイルを選択的にエクスポートすることも可能です。たとえば、vocab ファイルのみをエクスポートする場合は、次のように行います。

In [None]:
model.export(export_dir='.', export_format=ExportFormat.VOCAB)

また、`evaluate_tflite` メソッドを使って tflite モデルを評価することも可能です。このステップには長い時間がかかります。

In [None]:
model.evaluate_tflite('model.tflite', validation_data)

## 高度な使用

`create` 関数は、`model_spec` パラメータがモデルの仕様を定義するため、このライブラリでは重要な部分です。現在、`BertQASpec` クラスがサポートされています。モデルには MobileBERT モデルと BERT ベースモデルの 2 つがあります。`create` 関数は次のステップで構成されています。

1. `model_spec` に基づいて質疑応答のモデルを作成します。
2. 質疑応答モデルをトレーニングします。

このセクションでは、モデルの調整やトレーニングハイパーパラメータの調整など、いくつかの高度なトピックを説明します。

### モデルの調整

`BertQASpec` クラスの `seq_len` や `query_len` パラメータなどのモデルインフラストラクチャを調整できます。

モデルの調整可能なパラメータは次のとおりです。

- `seq_len`: モデルにフィードする文章の長さ。
- `query_len`: モデルにフィードする質問の長さ。
- `doc_stride`: ドキュメントの塊を取るためのスライドウィンドウアプローチを実行する際のストライド。
- `initializer_range`: すべての重み行列を初期化する truncated_normal_initializer の stdev。
- `trainable`: トレーニング済みレイヤーがトレーニング可能かどうかを示すブール型。

トレーニングパイプラインの調整可能なパラメータは次のとおりです。

- `model_dir`: モデルチェックポイントファイルの場所。設定されていない場合、一時ディレクトリが使用されます。
- `dropout_rate`: ドロップアウトのレート。
- `learning_rate`: Adam の初期学習率。
- `predict_batch_size`: 予測のバッチサイズ。
- `tpu`: 接続先の TPU アドレス。TPU を使用している場合にのみ使用されます。


たとえば、より長いシーケンス長でモデルをトレーニングできます。モデルを変更する場合、最初に新しい `model_spec` を構築する必要があります。

In [None]:
new_spec = model_spec.get('mobilebert_qa')
new_spec.seq_len = 512

残りのステップは同じです。モデルの仕様によって異なる前処理ステップがあるため、`dataloader` と `create` の両方の部分を再実行する必要があります。


### トレーニングハイパーパラメータの調整

`epochs` や `batch_size` など、モデルのパフォーマンスに影響のあるトレーニングハイパーパラメータを調整することもできます。次にその例を示します。

- `epochs`: エポック数が多いほどパフォーマンスが改善されますが、過適合が発生する可能性があります。
- `batch_size`: 1 つのトレーニングステップに使用するサンプル数。

たとえば、エポック数とバッチサイズを増やしてトレーニングすることができます。

```python
model = question_answer.create(train_data, model_spec=spec, epochs=5, batch_size=64)
```

### モデルアーキテクチャを変更する

`model_spec` を変更して、データをトレーニングするベースモデルを変更できます。たとえば、BERT ベースモデルに変更するには、次を実行します。

```python
spec = model_spec.get('bert_qa')
```

残りのステップは同じです。

### TensorFlow Lite モデルでポストトレーニング量子化をカスタマイズする

[ポストトレーニング量子化](https://www.tensorflow.org/lite/performance/post_training_quantization)は、モデルサイズと推論レイテンシを縮小できる変換テクニックです。このテクニックでは、モデル精度にほとんど影響することなく、CPU とハードウェアアクセラレータの推論速度も改善することができます。したがって、モデルを改善するために広く使われています。

Model Maker ライブラリは、モデルをエクスポートする際に、デフォルトのポストトレーニング量子化手法を適用します。ポストトレーニング量子化をカスタマイズするのであれば、Model Maker は、[QuantizationConfig](https://www.tensorflow.org/lite/api_docs/python/tflite_model_maker/config/QuantizationConfig) を使った複数のポストトレーニング量子化オプションもサポートしています。例として、float16 量子化を見てみましょう。まず、量子化構成を定義します。

```python
config = QuantizationConfig.for_float16()
```

次に、その構成で TensorFlow Lite モデルをエクスポートします。

```python
model.export(export_dir='.', tflite_filename='model_fp16.tflite', quantization_config=config)
```

# その他の資料

技術的な詳細については、[BERT 質疑応答](https://www.tensorflow.org/lite/examples/bert_qa/overview)の例をご覧ください。詳細については、以下をご覧ください。

- TensorFlow Lite Model Maker の[ガイド](https://www.tensorflow.org/lite/guide/model_maker)と [API リファレンス](https://www.tensorflow.org/lite/api_docs/python/tflite_model_maker)
- タスクライブラリ: デプロイ用の [BertQuestionAnswerer](https://www.tensorflow.org/lite/inference_with_metadata/task_library/bert_question_answerer)
- エンドツーエンドリファレンスアプリ: [Android](https://github.com/tensorflow/examples/tree/master/lite/examples/bert_qa/android) およおび [iOS](https://github.com/tensorflow/examples/tree/master/lite/examples/bert_qa/ios)