background image

PHP 读取 TXT 文件向数据库导入海量数据的方法

本文主要介绍,基于 PHP 读取 TXT 文件向数据库导入海量数据的方法。供大家参考下
有一个 TXT 文件,包含了 10 万条记录,格式如下:
列 1 列 2 列 3 列 4 列 5
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1
……………………后面有 10

………………

万条

需求是要导入数据库中,数据表的结构为
word_id 自动增量
word 【adductive#1 adducting#1 adducent#1】这一个 TXT 记录要转换为 3 个 SQL 记录
value =第三列-第四列;如果=0,则此条记录略过不插入数据表

 

复制代码 代码如下:

<?php
$file = 'words.txt';//10W 条记录的 TXT 源文件
$lines = file_get_contents($file); 
ini_set('memory_limit', '-1');//不要限制 Mem

 

大小,否则会报错

$line=explode("\n",$lines);
$i=0;
$sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES ";

foreach($line as $key =>$li)
{
$arr=explode(" ",$li); 
$senti_value=$arr[2]-$arr[3];
if($senti_value!=0)
{
if($i>=20000&&$i<25000)//分批次导入,避免失败
{
$mm=explode(" ",$arr[4]); 
foreach($mm as $m) //【adductive#1 adducting#1 adducent#1】这一个 TXT 记录要转换为 3 个
SQL

 

记录 {

$nn=explode("#",$m);
$word=$nn[0];
$sql.="(\"$word\",1,$senti_value,2),";//

 

这个地方要注意到是 word 有可能包含单引号(如

jack's),因此我们要用双引号来包含 word

 

(注意转义)