##### Copyright 2019 The TensorFlow Authors.

In [1]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# 特徴量列を使用して構造化データを分類する

<table class="tfo-notebook-buttons" align="left">
  <td>     <a target="_blank" href="https://www.tensorflow.org/tutorials/structured_data/feature_columns"><img src="https://www.tensorflow.org/images/tf_logo_32px.png">TensorFlow.org で表示</a> </td>
  <td>     <a target="_blank" href="https://colab.research.google.com/github/tensorflow/docs-l10n/blob/master/site/ja/tutorials/structured_data/feature_columns.ipynb">     <img src="https://www.tensorflow.org/images/colab_logo_32px.png">     Google Colab で実行</a> </td>
  <td><a target="_blank" href="https://github.com/tensorflow/docs-l10n/blob/master/site/ja/tutorials/structured_data/feature_columns.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png">GitHub でソースを表示</a></td>
  <td>     <a href="https://storage.googleapis.com/tensorflow_docs/docs-l10n/site/ja/tutorials/structured_data/feature_columns.ipynb"><img src="https://www.tensorflow.org/images/download_logo_32px.png">ノートブックをダウンロード</a> </td>
</table>

> 警告: このチュートリアルで説明されている `tf.feature_columns` モジュールは、新しいコードにはお勧めしません。 [Keras 前処理レイヤー](https://www.tensorflow.org/tutorials/structured_data/preprocessing_layers)がこの機能をカバーしています。移行手順については、[特徴量列の移行](../../guide/migrate/migrating_feature_columns.ipynb)ガイドをご覧ください。`tf.feature_columns` モジュールは、TF1 `Estimators` で使用するために設計されました。[互換性保証](https://tensorflow.org/guide/versions)の対象となりますが、セキュリティの脆弱性以外の修正は行われません。

This tutorial demonstrates how to classify structured data (e.g. tabular data in a CSV). We will use [Keras](https://www.tensorflow.org/guide/keras) to define the model, and `tf.feature_column` as a bridge to map from columns in a CSV to features used to train the model. This tutorial contains complete code to:

- [Pandas](https://pandas.pydata.org/) を使用して CSV ファイルを読み込みます。
- [tf.data](https://www.tensorflow.org/guide/datasets) を使用して、行をバッチ化してシャッフルする入力パイプラインを構築します。
- 特徴量の列を使ってモデルをトレーニングするために使用する特徴量に、CSV の列をマッピングします。
- Kerasを使ったモデルの構築と、訓練及び評価

## データセット

下記はこのデータセットの[說明](https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/heart-disease.names)です。数値列とカテゴリー列があることに注目してください。

Following is a description of this dataset. Notice there are both numeric and categorical columns. There is a free text column which we will not use in this tutorial.

列 | 説明 | 特徴量の型 | データ型
--- | --- | --- | ---
Type | 動物の種類（犬、猫） | カテゴリカル | 文字列
Age | ペットの年齢 | 数値 | 整数
Breed1 | ペットの主な品種 | カテゴリカル | 文字列
Color1 | ペットの毛色 1 | カテゴリカル | 文字列
Color2 | ペットの毛色 2 | カテゴリカル | 文字列
MaturitySize | 成獣時のサイズ | カテゴリカル | 文字列
FurLength | 毛の長さ | カテゴリカル | 文字列
Vaccinated | 予防接種済み | カテゴリカル | 文字列
Sterilized | 不妊手術済み | カテゴリカル | 文字列
Health | 健康状態 | カテゴリカル | 文字列
Fee | 引き取り料 | 数値 | 整数
Description | ペットのプロフィール | テキスト | 文字列
PhotoAmt | アップロードされたペットの写真数 | 数値 | 整数
AdoptionSpeed | 引き取りまでの期間 | 分類 | 整数

## TensorFlow他ライブラリのインポート

In [2]:
!pip install sklearn

Collecting sklearn


  Downloading sklearn-0.0.post1.tar.gz (3.6 kB)


  Preparing metadata (setup.py) ... [?25l- error
  [1;31merror[0m: [1msubprocess-exited-with-error[0m
  
  [31m×[0m [32mpython setup.py egg_info[0m did not run successfully.
  [31m│[0m exit code: [1;36m1[0m
  [31m╰─>[0m [31m[18 lines of output][0m
  [31m   [0m The 'sklearn' PyPI package is deprecated, use 'scikit-learn'
  [31m   [0m rather than 'sklearn' for pip commands.
  [31m   [0m 
  [31m   [0m Here is how to fix this error in the main use cases:
  [31m   [0m - use 'pip install scikit-learn' rather than 'pip install sklearn'
  [31m   [0m - replace 'sklearn' by 'scikit-learn' in your pip requirements files
  [31m   [0m   (requirements.txt, setup.py, setup.cfg, Pipfile, etc ...)
  [31m   [0m - if the 'sklearn' package is used by one of your dependencies,
  [31m   [0m   it would be great if you take some time to track which package uses
  [31m   [0m   'sklearn' instead of 'scikit-learn' and report it to their issue tracker
  [31m

In [3]:
import numpy as np
import pandas as pd

import tensorflow as tf

from tensorflow import feature_column
from tensorflow.keras import layers
from sklearn.model_selection import train_test_split

2022-12-14 23:03:28.983998: W tensorflow/compiler/xla/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libnvinfer.so.7'; dlerror: libnvinfer.so.7: cannot open shared object file: No such file or directory
2022-12-14 23:03:28.984090: W tensorflow/compiler/xla/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libnvinfer_plugin.so.7'; dlerror: libnvinfer_plugin.so.7: cannot open shared object file: No such file or directory


## Pandasを使ったデータフレーム作成

[Pandas](https://pandas.pydata.org/)は、構造化データの読み込みや操作のための便利なユーティリティを持つPythonのライブラリです。ここでは、Pandasを使ってURLからデータをダウンロードし、データフレームに読み込みます。

In [4]:
import pathlib

dataset_url = 'http://storage.googleapis.com/download.tensorflow.org/data/petfinder-mini.zip'
csv_file = 'datasets/petfinder-mini/petfinder-mini.csv'

tf.keras.utils.get_file('petfinder_mini.zip', dataset_url,
                        extract=True, cache_dir='.')
dataframe = pd.read_csv(csv_file)

Downloading data from http://storage.googleapis.com/download.tensorflow.org/data/petfinder-mini.zip


   8192/1668792 [..............................] - ETA: 0s



In [5]:
dataframe.head()

Unnamed: 0,Type,Age,Breed1,Gender,Color1,Color2,MaturitySize,FurLength,Vaccinated,Sterilized,Health,Fee,Description,PhotoAmt,AdoptionSpeed
0,Cat,3,Tabby,Male,Black,White,Small,Short,No,No,Healthy,100,Nibble is a 3+ month old ball of cuteness. He ...,1,2
1,Cat,1,Domestic Medium Hair,Male,Black,Brown,Medium,Medium,Not Sure,Not Sure,Healthy,0,I just found it alone yesterday near my apartm...,2,0
2,Dog,1,Mixed Breed,Male,Brown,White,Medium,Medium,Yes,No,Healthy,0,Their pregnant mother was dumped by her irresp...,7,3
3,Dog,4,Mixed Breed,Female,Black,Brown,Medium,Short,Yes,No,Healthy,150,"Good guard dog, very alert, active, obedience ...",8,2
4,Dog,1,Mixed Breed,Male,Black,No Color,Medium,Short,No,No,Healthy,0,This handsome yet cute boy is up for adoption....,3,2


## ターゲット変数を作成する

元のデータセットでは、ペットが引き取られるまでの期間 (1 週目、1 か月目、3 か月目など) を予測することがタスクとなっていますが、このチュートリアルでは、このタスクを単純化します。ここでは、このタスクを二項分類問題にし、単にペットが引き取られるかどうかのみを予測します。

ラベルの列を変更すると、0 は引き取られなかった、1 は引き取られたことを示すようになります。

In [6]:
# In the original dataset "4" indicates the pet was not adopted.
dataframe['target'] = np.where(dataframe['AdoptionSpeed']==4, 0, 1)

# Drop un-used columns.
dataframe = dataframe.drop(columns=['AdoptionSpeed', 'Description'])

## データフレームを、訓練用、検証用、テスト用に分割

ダウンロードしたデータセットは1つのCSVファイルです。これを、訓練用、検証用、テスト用のデータセットに分割します。

In [7]:
train, test = train_test_split(dataframe, test_size=0.2)
train, val = train_test_split(train, test_size=0.2)
print(len(train), 'train examples')
print(len(val), 'validation examples')
print(len(test), 'test examples')

7383 train examples
1846 validation examples
2308 test examples


## tf.dataを使った入力パイプラインの構築

次に、[tf.data](https://www.tensorflow.org/guide/datasets) を使ってデータフレームをラップします。こうすることで、特徴量の列を Pandas データフレームの列からモデルトレーニング用の特徴量へのマッピングするための橋渡し役として使うことができます。(メモリに収まらないぐらいの) 非常に大きな CSV ファイルを扱う場合には、tf.data を使ってディスクから直接 CSV ファイルを読み込むことになります。この方法は、このチュートリアルでは取り上げません。

In [8]:
# A utility method to create a tf.data dataset from a Pandas Dataframe
def df_to_dataset(dataframe, shuffle=True, batch_size=32):
  dataframe = dataframe.copy()
  labels = dataframe.pop('target')
  ds = tf.data.Dataset.from_tensor_slices((dict(dataframe), labels))
  if shuffle:
    ds = ds.shuffle(buffer_size=len(dataframe))
  ds = ds.batch(batch_size)
  return ds

In [9]:
batch_size = 5 # A small batch sized is used for demonstration purposes
train_ds = df_to_dataset(train, batch_size=batch_size)
val_ds = df_to_dataset(val, shuffle=False, batch_size=batch_size)
test_ds = df_to_dataset(test, shuffle=False, batch_size=batch_size)

## 入力パイプラインを理解する

入力パイプラインを構築したので、それが返すデータのフォーマットを見るために呼び出してみましょう。出力を読みやすくするためにバッチサイズを小さくしてあります。

In [10]:
for feature_batch, label_batch in train_ds.take(1):
  print('Every feature:', list(feature_batch.keys()))
  print('A batch of ages:', feature_batch['Age'])
  print('A batch of targets:', label_batch )

Every feature: ['Type', 'Age', 'Breed1', 'Gender', 'Color1', 'Color2', 'MaturitySize', 'FurLength', 'Vaccinated', 'Sterilized', 'Health', 'Fee', 'PhotoAmt']
A batch of ages: tf.Tensor([ 2  2 24  1  3], shape=(5,), dtype=int64)
A batch of targets: tf.Tensor([1 0 0 1 1], shape=(5,), dtype=int64)


ご覧のとおり、データセットは、データフレームの行から列の値にマップしている列名の (データフレームの列名) のディクショナリを返しています。

## 特徴量列の様々な型のデモ

TensorFlow には様々な型の特徴量列があります。このセクションでは、いくつかの型の特徴量列を作り、データフレームの列をどのように変換するかを示します。

In [11]:
# We will use this batch to demonstrate several types of feature columns
example_batch = next(iter(train_ds))[0]

In [12]:
# feature columnsを作りデータのバッチを変換する
# ユーティリティメソッド
def demo(feature_column):
  feature_layer = layers.DenseFeatures(feature_column)
  print(feature_layer(example_batch).numpy())

### 数値コラム

特徴量列の出力はモデルへの入力になります (上記で定義したデモ関数を使うと、データフレームの列がどのように変換されるかを見ることができます)。[数値列](https://www.tensorflow.org/api_docs/python/tf/feature_column/numeric_column)は、最も単純な型の列です。数値列は実数特徴量を表現するのに使われます。この列を使う場合、モデルにはデータフレームの列の値がそのまま渡されます。

In [13]:
photo_count = feature_column.numeric_column('PhotoAmt')
demo(photo_count)

[[1.]
 [3.]
 [5.]
 [3.]
 [5.]]


PetFinder データセットでは、データフレームのほとんどの列がカテゴリカル型です。

### バケット化コラム

数値をそのままモデルに入力するのではなく、値の範囲に基づいた異なるカテゴリに分割したいことがあります。例えば、人の年齢を表す生データを考えてみましょう。[バケット化列](https://www.tensorflow.org/api_docs/python/tf/feature_column/bucketized_column)を使うと年齢を数値列として表現するのではなく、年齢をいくつかのバケットに分割できます。以下のワンホット値が、各行がどの年齢範囲にあるかを表していることに注目してください。

In [14]:
age = feature_column.numeric_column('Age')
age_buckets = feature_column.bucketized_column(age, boundaries=[1, 3, 5])
demo(age_buckets)

[[0. 0. 1. 0.]
 [0. 1. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 0. 1.]
 [0. 0. 0. 1.]]


### カテゴリー型コラム

このデータセットでは、型は (「犬」や「猫」などの) 文字列として表現されています。文字列を直接モデルに入力することはできません。まず、文字列を数値にマッピングする必要があります。カテゴリカル語彙列を使うと、(上記で示した年齢バケットのように) 文字列をワンホットベクトルとして表現することができます。語彙は[categorical_column_with_vocabulary_list](https://www.tensorflow.org/api_docs/python/tf/feature_column/categorical_column_with_vocabulary_list) を使ってリストで渡すか、[categorical_column_with_vocabulary_file](https://www.tensorflow.org/api_docs/python/tf/feature_column/categorical_column_with_vocabulary_file) を使ってファイルから読み込むことができます。

In [15]:
animal_type = feature_column.categorical_column_with_vocabulary_list(
      'Type', ['Cat', 'Dog'])

animal_type_one_hot = feature_column.indicator_column(animal_type)
demo(animal_type_one_hot)

[[0. 1.]
 [0. 1.]
 [0. 1.]
 [0. 1.]
 [0. 1.]]


### 埋め込み型コラム

数種類の文字列ではなく、カテゴリごとに数千 (あるいはそれ以上) の値があるとしましょう。カテゴリの数が多くなってくると、様々な理由から、ワンホットエンコーディングを使ってニューラルネットワークをトレーニングすることが難しくなります。埋め込み列を使うと、こうした制約を克服することが可能です。[埋め込み列](https://www.tensorflow.org/api_docs/python/tf/feature_column/embedding_column)は、データを多次元のワンホットベクトルとして表すのではなく、セルの値が 0 か 1 かだけではなく、どんな数値でもとれるような密な低次元ベクトルとして表現します。埋め込みのサイズ (下記の例では 8) は、チューニングが必要なパラメータです。

重要ポイント: カテゴリカル列が多くの選択肢を持つ場合、埋め込み列を使用することが最善の方法です。ここでは例を一つ示しますので、今後様々なデータセットを扱う際には、この例を参考にしてください。

In [16]:
# Notice the input to the embedding column is the categorical column
# we previously created
breed1 = feature_column.categorical_column_with_vocabulary_list(
      'Breed1', dataframe.Breed1.unique())
breed1_embedding = feature_column.embedding_column(breed1, dimension=8)
demo(breed1_embedding)

[[-0.65292776 -0.48165944 -0.34872264 -0.40858582 -0.04265913  0.26578084
   0.4366054  -0.2958504 ]
 [-0.65292776 -0.48165944 -0.34872264 -0.40858582 -0.04265913  0.26578084
   0.4366054  -0.2958504 ]
 [-0.65292776 -0.48165944 -0.34872264 -0.40858582 -0.04265913  0.26578084
   0.4366054  -0.2958504 ]
 [-0.65292776 -0.48165944 -0.34872264 -0.40858582 -0.04265913  0.26578084
   0.4366054  -0.2958504 ]
 [ 0.10934287  0.43237892 -0.6214551  -0.26910862 -0.06913823 -0.09724928
  -0.00828571 -0.2563711 ]]


### ハッシュ化特徴量列

値の種類が多いカテゴリカル列を表現するもう一つの方法として、[categorical_column_with_hash_bucket](https://www.tensorflow.org/api_docs/python/tf/feature_column/categorical_column_with_hash_bucket) を使うことができます。この特徴量列は入力のハッシュ値を計算し、文字列をエンコードするために `hash_bucket_size` バケットの 1 つを選択します。この列を使用する場合には、語彙を用意する必要はありません。また、スペースの節約のために、実際のカテゴリ数に比べて極めて少ない hash_buckets 数を選択することも可能です。

重要ポイント: この手法の重要な欠点の一つは、異なる文字列が同じバケットにマッピングされ、衝突が発生する可能性があるということです。しかしながら、データセットによっては問題が発生しない場合もあります。

In [17]:
breed1_hashed = feature_column.categorical_column_with_hash_bucket(
      'Breed1', hash_bucket_size=10)
demo(feature_column.indicator_column(breed1_hashed))

[[0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]]


### フィーチャークロス列

複数の特徴量をまとめて1つの特徴量にする、[フィーチャークロス](https://developers.google.com/machine-learning/glossary/#feature_cross)として知られている手法は、モデルが特徴量の組み合わせの一つ一つに別々の重みを学習することを可能にします。ここでは年齢と型を交差させて新しい特徴量を作ってみます。(`crossed_column`) は、起こりうるすべての組み合わせ全体の表 (これは非常に大きくなる可能性があります) を作るものではないことに注意してください。フィーチャークロス列は、代わりにバックエンドとして `hashed_column` を使用しているため、表の大きさを選択することができます。

In [18]:
crossed_feature = feature_column.crossed_column([age_buckets, animal_type], hash_bucket_size=10)
demo(feature_column.indicator_column(crossed_feature))

[[0. 0. 0. 0. 0. 0. 1. 0. 0. 0.]
 [0. 1. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 1. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 1. 0.]]


## 使用するコラムを選択する

これまで、いくつかの特徴量列の使い方を見てきました。これからモデルのトレーニングにそれらを使用します。このチュートリアルの目的は、特徴量列を使うのに必要な完全なコード (いわば仕組み) を示すことです。以下ではモデルをトレーニングするための列を適当に選びました。

キーポイント：正確なモデルを構築するのが目的である場合には、できるだけ大きなデータセットを使用して、どの特徴量を含めるのがもっとも意味があるのかや、それらをどう表現したらよいかを、慎重に検討してください。

In [19]:
feature_columns = []

# numeric cols
for header in ['PhotoAmt', 'Fee', 'Age']:
  feature_columns.append(feature_column.numeric_column(header))

In [20]:
# bucketized cols
age = feature_column.numeric_column('Age')
age_buckets = feature_column.bucketized_column(age, boundaries=[1, 2, 3, 4, 5])
feature_columns.append(age_buckets)

In [21]:
# indicator_columns
indicator_column_names = ['Type', 'Color1', 'Color2', 'Gender', 'MaturitySize',
                          'FurLength', 'Vaccinated', 'Sterilized', 'Health']
for col_name in indicator_column_names:
  categorical_column = feature_column.categorical_column_with_vocabulary_list(
      col_name, dataframe[col_name].unique())
  indicator_column = feature_column.indicator_column(categorical_column)
  feature_columns.append(indicator_column)

In [22]:
# embedding columns
breed1 = feature_column.categorical_column_with_vocabulary_list(
      'Breed1', dataframe.Breed1.unique())
breed1_embedding = feature_column.embedding_column(breed1, dimension=8)
feature_columns.append(breed1_embedding)

In [23]:
# crossed columns
age_type_feature = feature_column.crossed_column([age_buckets, animal_type], hash_bucket_size=100)
feature_columns.append(feature_column.indicator_column(age_type_feature))

### 特徴量層の構築

特徴量列を定義したので、次に [DenseFeatures](https://www.tensorflow.org/versions/r2.0/api_docs/python/tf/keras/layers/DenseFeatures) レイヤーを使って Keras モデルに入力します。

In [24]:
feature_layer = tf.keras.layers.DenseFeatures(feature_columns)

これまでは、feature columnsの働きを見るため、小さなバッチサイズを使ってきました。ここではもう少し大きなバッチサイズの新しい入力パイプラインを作ります。

In [25]:
batch_size = 32
train_ds = df_to_dataset(train, batch_size=batch_size)
val_ds = df_to_dataset(val, shuffle=False, batch_size=batch_size)
test_ds = df_to_dataset(test, shuffle=False, batch_size=batch_size)

## モデルの構築、コンパイルと訓練

In [26]:
model = tf.keras.Sequential([
  feature_layer,
  layers.Dense(128, activation='relu'),
  layers.Dense(128, activation='relu'),
  layers.Dropout(.1),
  layers.Dense(1)
])

model.compile(optimizer='adam',
              loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              metrics=['accuracy'])

model.fit(train_ds,
          validation_data=val_ds,
          epochs=10)

Epoch 1/10






  1/231 [..............................] - ETA: 9:36 - loss: 0.8451 - accuracy: 0.6562

  2/231 [..............................] - ETA: 35s - loss: 0.9735 - accuracy: 0.6094 

  3/231 [..............................] - ETA: 35s - loss: 0.8324 - accuracy: 0.5625

  4/231 [..............................] - ETA: 34s - loss: 0.7738 - accuracy: 0.5234

  6/231 [..............................] - ETA: 28s - loss: 0.7484 - accuracy: 0.5521

  9/231 [>.............................] - ETA: 21s - loss: 0.8084 - accuracy: 0.5590

 11/231 [>.............................] - ETA: 21s - loss: 0.8352 - accuracy: 0.5682

 19/231 [=>............................] - ETA: 11s - loss: 0.7806 - accuracy: 0.5888

 21/231 [=>............................] - ETA: 12s - loss: 0.7551 - accuracy: 0.6042

 29/231 [==>...........................] - ETA: 8s - loss: 0.7417 - accuracy: 0.6358 

 37/231 [===>..........................] - ETA: 6s - loss: 0.6997 - accuracy: 0.6461

 40/231 [====>.........................] - ETA: 7s - loss: 0.7146 - accuracy: 0.6461

 44/231 [====>.........................] - ETA: 7s - loss: 0.7160 - accuracy: 0.6449

 53/231 [=====>........................] - ETA: 5s - loss: 0.7010 - accuracy: 0.6568















































Epoch 2/10


  1/231 [..............................] - ETA: 12s - loss: 0.6539 - accuracy: 0.5938

  9/231 [>.............................] - ETA: 1s - loss: 0.6977 - accuracy: 0.6562 

 17/231 [=>............................] - ETA: 1s - loss: 0.6418 - accuracy: 0.6857

 25/231 [==>...........................] - ETA: 1s - loss: 0.6285 - accuracy: 0.6850

 34/231 [===>..........................] - ETA: 1s - loss: 0.6275 - accuracy: 0.6829

 43/231 [====>.........................] - ETA: 1s - loss: 0.6080 - accuracy: 0.6897

 52/231 [=====>........................] - ETA: 1s - loss: 0.6041 - accuracy: 0.7013











































Epoch 3/10


  1/231 [..............................] - ETA: 13s - loss: 0.3559 - accuracy: 0.8438

 10/231 [>.............................] - ETA: 1s - loss: 0.4860 - accuracy: 0.7719 

 19/231 [=>............................] - ETA: 1s - loss: 0.5049 - accuracy: 0.7220

 28/231 [==>...........................] - ETA: 1s - loss: 0.5094 - accuracy: 0.7344

 37/231 [===>..........................] - ETA: 1s - loss: 0.5086 - accuracy: 0.7289

 46/231 [====>.........................] - ETA: 1s - loss: 0.5147 - accuracy: 0.7283











































Epoch 4/10


  1/231 [..............................] - ETA: 13s - loss: 0.4506 - accuracy: 0.8125

 10/231 [>.............................] - ETA: 1s - loss: 0.5626 - accuracy: 0.6844 

 18/231 [=>............................] - ETA: 1s - loss: 0.5274 - accuracy: 0.7118

 26/231 [==>...........................] - ETA: 1s - loss: 0.5269 - accuracy: 0.7175

 35/231 [===>..........................] - ETA: 1s - loss: 0.5295 - accuracy: 0.7089

 44/231 [====>.........................] - ETA: 1s - loss: 0.5135 - accuracy: 0.7188

 53/231 [=====>........................] - ETA: 1s - loss: 0.5128 - accuracy: 0.7176











































Epoch 5/10


  1/231 [..............................] - ETA: 14s - loss: 0.3123 - accuracy: 0.9062

 10/231 [>.............................] - ETA: 1s - loss: 0.5098 - accuracy: 0.7094 

 19/231 [=>............................] - ETA: 1s - loss: 0.5061 - accuracy: 0.7155

 28/231 [==>...........................] - ETA: 1s - loss: 0.4828 - accuracy: 0.7411

 37/231 [===>..........................] - ETA: 1s - loss: 0.4857 - accuracy: 0.7449

 46/231 [====>.........................] - ETA: 1s - loss: 0.4883 - accuracy: 0.7391











































Epoch 6/10


  1/231 [..............................] - ETA: 13s - loss: 0.4674 - accuracy: 0.6562

 10/231 [>.............................] - ETA: 1s - loss: 0.4551 - accuracy: 0.7594 

 19/231 [=>............................] - ETA: 1s - loss: 0.4990 - accuracy: 0.7319

 28/231 [==>...........................] - ETA: 1s - loss: 0.5022 - accuracy: 0.7266

 36/231 [===>..........................] - ETA: 1s - loss: 0.5009 - accuracy: 0.7370

 45/231 [====>.........................] - ETA: 1s - loss: 0.4973 - accuracy: 0.7361













































Epoch 7/10


  1/231 [..............................] - ETA: 14s - loss: 0.5364 - accuracy: 0.6562

 10/231 [>.............................] - ETA: 1s - loss: 0.4561 - accuracy: 0.7406 

 19/231 [=>............................] - ETA: 1s - loss: 0.4816 - accuracy: 0.7319

 28/231 [==>...........................] - ETA: 1s - loss: 0.4579 - accuracy: 0.7623

 37/231 [===>..........................] - ETA: 1s - loss: 0.4641 - accuracy: 0.7618

 46/231 [====>.........................] - ETA: 1s - loss: 0.4740 - accuracy: 0.7561











































Epoch 8/10


  1/231 [..............................] - ETA: 14s - loss: 0.4875 - accuracy: 0.7188

  9/231 [>.............................] - ETA: 1s - loss: 0.3927 - accuracy: 0.7812 

 18/231 [=>............................] - ETA: 1s - loss: 0.4480 - accuracy: 0.7622

 27/231 [==>...........................] - ETA: 1s - loss: 0.4533 - accuracy: 0.7523

 36/231 [===>..........................] - ETA: 1s - loss: 0.4495 - accuracy: 0.7587

 45/231 [====>.........................] - ETA: 1s - loss: 0.4480 - accuracy: 0.7625

 53/231 [=====>........................] - ETA: 1s - loss: 0.4490 - accuracy: 0.7647











































Epoch 9/10


  1/231 [..............................] - ETA: 9s - loss: 0.2727 - accuracy: 0.8125

 10/231 [>.............................] - ETA: 1s - loss: 0.4510 - accuracy: 0.7563

 19/231 [=>............................] - ETA: 1s - loss: 0.4520 - accuracy: 0.7697

 28/231 [==>...........................] - ETA: 1s - loss: 0.4469 - accuracy: 0.7746

 37/231 [===>..........................] - ETA: 1s - loss: 0.4511 - accuracy: 0.7728

 46/231 [====>.........................] - ETA: 1s - loss: 0.4461 - accuracy: 0.7812















































Epoch 10/10


  1/231 [..............................] - ETA: 13s - loss: 0.5764 - accuracy: 0.5938

  9/231 [>.............................] - ETA: 1s - loss: 0.4478 - accuracy: 0.7326 

 17/231 [=>............................] - ETA: 1s - loss: 0.4516 - accuracy: 0.7390

 25/231 [==>...........................] - ETA: 1s - loss: 0.4528 - accuracy: 0.7513

 33/231 [===>..........................] - ETA: 1s - loss: 0.4618 - accuracy: 0.7453

 42/231 [====>.........................] - ETA: 1s - loss: 0.4558 - accuracy: 0.7552

 50/231 [=====>........................] - ETA: 1s - loss: 0.4624 - accuracy: 0.7519











































<keras.callbacks.History at 0x7f8ac8cb1730>

In [27]:
loss, accuracy = model.evaluate(test_ds)
print("Accuracy", accuracy)

 1/73 [..............................] - ETA: 1s - loss: 0.4931 - accuracy: 0.6562

11/73 [===>..........................] - ETA: 0s - loss: 0.5017 - accuracy: 0.7273













Accuracy 0.7287694811820984


重要ポイント: 通常、データベースの規模が大きく複雑であるほど、ディープラーニングの結果がよくなります。このチュートリアルのデータセットのように、小さなデータセットを使用する場合は、決定木またはランダムフォレストを強力なベースラインとして使用することをお勧めします。このチュートリアルでは、構造化データとの連携の仕組みを実演することが目的であり、コードは将来的に独自のデータセットを使用する際の出発点として使用することができます。

## 次のステップ

構造化データの分類をさらに学習するには、ご自分で別のデータセットを使用し、上記のようなコードを使用し、モデルのトレーニングと分類を試してみてください。正解度を改善するには、モデルに含める特徴量とその表現方法を吟味してください。