处理后的符合某种规定格式的特定数据,如字节流序列、字符流序列等。数据的性质、格式不
同,则对流的处理方法也不同,因此,
Java 的输入/输出类库中有不同的流类来对应不同性
质的输入
/输出流。在 java.io 包中基本输入/输出流类可按读写数据的不同类型分为两种:字
节流和字符流。
②文件的输入
/输出
Java 语言的 java.io 包中的 File 类是专门用来管理磁盘文件和目录的。每个 File 类的对象
表示一个磁盘文件或目录,其对象属性
中包含了文件或目录的相关信息,如文件或目录的
名称、文件的长度、目录中所含文件的个数等。调用
File 类的方法则可以完成对文件或目录的
常用管理操作,如创建文件或目录、删除文件或目录、查看文件的有关信息等。
2.2.2 使用到的 Java 包介绍
1)java.io 包
java.省略包
java.net 包支持 TCP/IP 网络协议,并包含 Socket 类及 URL 相关的类,是网络编程中要
使用到的。
3)java.util 包
java.util 包包含集合框架、遗留的 collection 类、事件模型、日期和时间设施、国际化和各
种实用工具类(字符串标记生成器、随机数生成器和位数组)。
4)java.text 包
java.text 包提供以与自然语言无关的方式来处理文本、日期、数字和消息的类和接口。
2.3 系统各部分的实现方法
2.3.1 command 包的设计与实现
1)MainVariable 类的设计与实现
类
MainVariable 用来保存程序中要用到的相当于全局变量作用的变量,这个类中只有
一个 静态
String 变量 HOME_PATH,它是整个程序输出的根目录, HOME_PATH 的值
是
"C:\\MyProgram"字符串。
2)MkDir 类的设计与实现
类
MkDir 用来建立多个目录,这个类中要引入 java.io 包、java.util 包和 java.text.省略包
和
java.io 包,这个类中只有一个静态方法 NetPageDown,它用来下载网页,它有两个参数
url 和 fileName,其中参数 url 是要下载的网页的地址,参数 fileName 是下载下来的网页在
硬盘上对应的文件。
4)DownPath 类的设计与实现
类
DownPath 是 各 个 网 站 下 载 的 路 径 , 这 个 类 包 括 十 个 String 变 量 :
tmpPath
、
Politics
、
ChinaPolitics
、
WorldPolitics
、
Sports
、
ChinaS?
ports、WorldSports、Finance、ChinaFinance、WorldFinance 和 Society,以及一个 DownPath 方法。
其中,
String 变量 tmpPath 是各个网站下载的根目录,String 变量 Politics 是政治新闻下载目
录,
String 变量 ChinaPolitics 是国内政治新闻下载目录等等。方法 DownPath 用来对下载路
径进行初始化,它有一个参数
net,是要下载的网站的网站名,其它类调用该方法给上面的
十个
String 变量重新赋值,让它们指向当前下载的网站的路径。
5)NewsPage 类的设计与实现
类
NewsPage 用 来 分 析 新 闻 主 页 , 这 个 类 中 要 引 入 5 个 包 , 分 别 是
java.io.BufferedWriter 包,java.io.File 包,java.io.FileWriter 包,ja? va.util.regex.Matcher 包和
java.util.regex.Pattern 包。这个类只有一个静态方法 AnalyzeNewspage,它用来找出新闻主页
中与正则表达式匹配的链接,并将这些链接保存到文件中。
6)SubStr 类的设计与实现