background image

处理后的符合某种规定格式的特定数据,如字节流序列、字符流序列等。数据的性质、格式不
同,则对流的处理方法也不同,因此,

Java 的输入/输出类库中有不同的流类来对应不同性

质的输入

/输出流。在 java.io 包中基本输入/输出流类可按读写数据的不同类型分为两种:字

节流和字符流。

 

  ②文件的输入

/输出 

  

Java 语言的 java.io 包中的 File 类是专门用来管理磁盘文件和目录的。每个 File 类的对象

表示一个磁盘文件或目录,其对象属性

 中包含了文件或目录的相关信息,如文件或目录的

名称、文件的长度、目录中所含文件的个数等。调用

File 类的方法则可以完成对文件或目录的

常用管理操作,如创建文件或目录、删除文件或目录、查看文件的有关信息等。

 

  

2.2.2 使用到的 Java 包介绍 

  

1)java.io 包 

  

java.省略包 

  

java.net 包支持 TCP/IP 网络协议,并包含 Socket 类及 URL 相关的类,是网络编程中要

使用到的。

 

  

3)java.util 包 

  

java.util 包包含集合框架、遗留的 collection 类、事件模型、日期和时间设施、国际化和各

种实用工具类(字符串标记生成器、随机数生成器和位数组)。

 

  

4)java.text 包 

  

java.text 包提供以与自然语言无关的方式来处理文本、日期、数字和消息的类和接口。 

  

2.3 系统各部分的实现方法 

  

2.3.1 command 包的设计与实现 

  

1)MainVariable 类的设计与实现 

  类

MainVariable 用来保存程序中要用到的相当于全局变量作用的变量,这个类中只有

一个 静态

String 变量 HOME_PATH,它是整个程序输出的根目录, HOME_PATH 的值

"C:\\MyProgram"字符串。 

  

2)MkDir 类的设计与实现 

  类

MkDir 用来建立多个目录,这个类中要引入 java.io 包、java.util 包和 java.text.省略包

java.io 包,这个类中只有一个静态方法 NetPageDown,它用来下载网页,它有两个参数

url 和 fileName,其中参数 url 是要下载的网页的地址,参数 fileName 是下载下来的网页在
硬盘上对应的文件。

 

  

4)DownPath 类的设计与实现 

    类

DownPath 是 各 个 网 站 下 载 的 路 径 , 这 个 类 包 括 十 个 String 变 量 :

tmpPath

Politics

ChinaPolitics

WorldPolitics

Sports

ChinaS? 

ports、WorldSports、Finance、ChinaFinance、WorldFinance 和 Society,以及一个 DownPath 方法。
其中,

String 变量 tmpPath 是各个网站下载的根目录,String 变量 Politics 是政治新闻下载目

录,

String 变量 ChinaPolitics 是国内政治新闻下载目录等等。方法 DownPath 用来对下载路

径进行初始化,它有一个参数

net,是要下载的网站的网站名,其它类调用该方法给上面的

十个

String 变量重新赋值,让它们指向当前下载的网站的路径。 

  

5)NewsPage 类的设计与实现 

    类

NewsPage 用 来 分 析 新 闻 主 页 , 这 个 类 中 要 引 入 5 个 包 , 分 别 是

java.io.BufferedWriter 包,java.io.File 包,java.io.FileWriter 包,ja? va.util.regex.Matcher 包和
java.util.regex.Pattern 包。这个类只有一个静态方法 AnalyzeNewspage,它用来找出新闻主页
中与正则表达式匹配的链接,并将这些链接保存到文件中。

 

  

6)SubStr 类的设计与实现