IMDB datasets Import - Import script fertig

Importieren von IMDB datasets als fertiges PHP CLI

Kommentieren Mar 26 2020 .txt, .json, .md

Wie hier schon angesprochen ist der Import nun fertig und kann hier als kleine Scriptsammlung geladen werden.

Als Konfiguration die import.php anpassen.

## files located in dataset/ directory
$filesToImport = array(
    'TitleAkas' => 'title.akas.tsv',
    'TitleBasics' => 'title.basics.tsv',
    'TitleCrew' => 'title.crew.tsv',
    'TitleEpisode' => 'title.episode.tsv',
    'TitlePrincipals' => 'title.principals.tsv',
    'TitleRatings' => 'title.ratings.tsv',
    'NameBasics' => 'name.basics.tsv'
);

## database settings
define('DB_HOST','localhost');
define('DB_USER','user');
define('DB_PASSWORD','test');
define('DB_NAME','imdb');

Im Verzeichnis datasets die entsprechenden Dateien ablegen und den Import als PHP CLI starten.

Das Ergebnis sieht (je nach Datenstand) so aus:

name_basics       ~8,133,108   761.0 MiB
title_akas        ~19,913,149  1.8   GiB
title_basics      ~6,557,173   802.0 MiB
title_crew        ~5,897,209   393.0 MiB
title_episode     ~4,290,057   254.8 MiB
title_principals  ~36,393,992  3.0   GiB
title_ratings     ~1,007,968   40.6  MiB
7 tables          ~82,192,656  7.0   GiB