day09-字符集、IO流(一)

YangeIT大约 18 分钟JavaSe字符流

day09-字符集、IO流(一)

相关信息

各位同学,前面我们已经学习了File类,通过File类的对象可以对文件进行操作,但是不能操作文件中的内容。要想操作文件中的内容,我们还得学习IO流。但是在正式学习IO流之前,我们还需要学习一个前置知识叫做字符集,只有我们把字符集搞明白了,再学习IO流才会更加丝滑。

1.字符集

1.1 字符集概述

字符集的来历

1.1 字符集的来历

所以,接下来我们正式学习一下字符集 。先来带着同学们,了解一下字符集的来历。

我们知道计算机是美国人发明的,由于计算机能够处理的数据只能是0和1组成的二进制 数据,为了让计算机能够处理字符,于是美国人就把他们会用到的每一个字符进行了编码 所谓编码,就是为一个字符编一个二进制数据),如下图所示:

1667738471094
1667738471094

美国人常用的字符有英文字母、标点符号、数字以及一些特殊字符,这些字符一共也不到128个,所以他们用1个字节来存储1字符就够了。 美国人把他们用到的字符和字符对应的编码总结成了一张码表,这张码表叫做ASCII码表(也叫ASCII字符集)。

其实计算机只在美国用是没有问题的,但是计算机慢慢的普及到全世界,当普及到中国的时候,在计算机中想要存储中文,那ASCII字符集就不够用了 ,因为中文太多了,随便数一数也有几万个字符。

于是中国人为了在计算机中存储中文,也编了一个中国人用的字符集叫做GBK字符集 ,这里面包含2万多个汉字字符,GBK中一个汉字采用两个字节来存储,为了能够显示英文字母,GBK字符集也兼容了ASCII字符集,在GBK字符集中一个字母还是采用一个字节来存储

字符集小结

ASCII字符集:《美国信息交换标准代码》,包含英文字母、数字、标点符号、控制字符 特点:1个字符占1个字节

GBK字符集:中国人自己的字符集,兼容ASCII字符集,还包含2万多个汉字 特点:1个字母占用1个字节;1个汉字占用2个字节

Unicode字符集:包含世界上所有国家的文字,有三种编码方案,最常用的是UTF-8 UTF-8编码方案:英文字母、数字占1个字节兼容(ASCII编码)、汉字字符占3个字节

编码和解码

搞清楚字符集的知识之后,我们接下来再带着同学们使用Java代码完成编码和解码的操作。

其实String类类中就提供了相应的方法,可以完成编码和解码的操作。

  • 编码 :把字符串按照指定的字符集转换为字节数组
  • 解码 :把字节数组按照指定的字符集转换为字符串
/**
 * 目标:掌握如何使用Java代码完成对字符的编码和解码。
 */
public class Test {
    public static void main(String[] args) throws Exception {
        // 1、编码
        String data = "a我b";
        byte[] bytes = data.getBytes(); // 默认是按照平台字符集(UTF-8)进行编码的。
        System.out.println(Arrays.toString(bytes));

        // 按照指定字符集进行编码。
        byte[] bytes1 = data.getBytes("GBK");
        System.out.println(Arrays.toString(bytes1));

        // 2、解码
        String s1 = new String(bytes); // 按照平台默认编码(UTF-8)解码
        System.out.println(s1);

        String s2 = new String(bytes1, "GBK");
        System.out.println(s2);
    }
}
image
image

总结

课堂作业

  1. 编码是什么?🎤
  2. GBK中一个汉字几个字节? 一个字母几个字节?
  3. UTF-8中汉字占几个字节? 英文字母占几个字节?
  4. 解码和编码是什么意思?

2.IO流(字节流)

2.1 IO流概述

IO流概述

各位小伙伴,在前面我们已经学习过File类。但是我们知道File只能操作文件,但是不能操作文件中的内容。我们也学习了字符集,不同的字符集存字符数据的原理是不一样的。有了前面两个知识的基础,接下来我们再学习IO流 ,就可以对文件中的数据进行操作了。

IO流的作用: 就是可以对文件或者网络中的数据进行读、写的操作 。如下图所示 👇

  • 把数据从磁盘、网络中读取到程序中来,用到的是输入流。
  • 把程序中的数据写入磁盘、网络中,用到的是输出流。
1667822945208
1667822945208
  • 简单记:输入流(读数据)、输出流(写数据)

IO流在Java中有很多种,不同的流来干不同的事情。Java把各种流用不同的类来表示,这些流的继承体系如下图所示:

IO流分为两大派系:
	1.字节流:字节流又分为字节输入流、字节输出流
	2.字符流:字符流由分为字符输入流、字符输出流
1667823186345
1667823186345

代码操作

FileInputStream读取一个字节

同学们,在上节课认识了什么是IO流,接下来我们学习字节流中的字节输入流,用InputStream来表示。但是InputStream是抽象类,我们用的是它的子类,叫FileInputStream。

1667823371395
1667823371395

需要用到的方法如下图所示:有构造方法、成员方法

1667823417184
1667823417184

使用FileInputStream读取文件中的字节数据,步骤如下

第一步:创建FileInputStream文件字节输入流管道,与源文件接通。
第二步:调用read()方法开始读取文件的字节数据。
第三步:调用close()方法释放资源

代码如下:


/**
 * 目标:掌握文件字节输入流,每次读取一个字节。
 */
public class FileInputStreamTest1 {
    public static void main(String[] args) throws Exception {
        // 1、创建文件字节输入流管道,与源文件接通。
        InputStream is = new FileInputStream("D:\\java168\\a.txt");

        // 2、开始读取文件的字节数据。
        // public int read():每次读取一个字节返回,如果没有数据了,返回-1.
        int b; // 用于记住读取的字节。
        while ((b = is.read()) != -1){
            System.out.print((char) b);
        }
        
        //3、流使用完毕之后,必须关闭!释放系统资源!
        is.close();
    }
}
image
image

这里需要注意一个问题: 由于一个中文在UTF-8编码方案中是占3个字节,采用一次读取一个字节的方式,读一个字节就相当于读了1/3个汉字,此时将这个字节转换为字符,是会有 乱码的

2.2 FileOutputStream写字节

FileOutputStream写字节

各位同学,前面我们学习了使用FIleInputStream读取文件中的字节数据。然后有同学就迫不及待的想学习往文件中写入数据了。

往文件中写数据需要用到OutputStream下面的一个子类FileOutputStream。写输入的流程如下图所示

1667830581838
1667830581838

使用FileOutputStream往文件中写数据的步骤如下:

第一步:创建FileOutputStream文件字节输出流管道,与目标文件接通。
第二步:调用wirte()方法往文件中写数据
第三步:调用close()方法释放资源

代码如下:

/**
 * 目标:掌握文件字节输出流FileOutputStream的使用。
 */
public class FileOutputStreamTest4 {
    public static void main(String[] args) throws Exception {
        // 1、创建一个字节输出流管道与目标文件接通。
        // 覆盖管道:覆盖之前的数据
//        OutputStream os =
//                new FileOutputStream("D:\\java168\\a.txt");

        // 追加数据的管道
        OutputStream os =
                new FileOutputStream("D:\\java168\\a.txt", true);

        // 2、开始写字节数据出去了
        os.write(97); // 97就是一个字节,代表a
        os.write('b'); // 'b'也是一个字节
        //os.write('磊'); // [ooo] 默认只能写出去一个字节,导致中文乱码

        byte[] bytes = "我爱你中国abc".getBytes();
        os.write(bytes);

        os.write(bytes, 0, 15);

        // 换行符
        os.write("\r\n".getBytes());

        os.close(); // 关闭流
    }
}

总结

课堂作业

  1. wirte()是什么意思?close()是什么意思?🎤
  2. 完成文件复制案例(自己找资源,图片,文本都可以)

3.IO流资源释放

IO流资源释放

各位同学,前面我们已经学习了字节流,也给同学们强调过,流使用完之后一定要释放资源。但是我们之前的代码并不是很专业。

1667831281147
1667831281147

我们现在知道这个问题了,那这个问题怎么解决呢? 在JDK7以前,和JDK7以后分别给出了不同的处理方案。

代码操作

JDK7以前的资源释放

在JDK7版本以前,我们可以使用try...catch...finally语句来处理。格式如下

try{
    //有可能产生异常的代码
}catch(异常类 e){
    //处理异常的代码
}finally{
    //释放资源的代码
    //finally里面的代码有一个特点,不管异常是否发生,finally里面的代码都会执行。
}

改造上面的低吗:


public class CopyTest6 {
    public static void main(String[] args)  {
        InputStream is = null;
        OutputStream os = null;
        try {
//            System.out.println(10 / 0);
            // 1、创建一个字节输入流管道与源文件接通
            // 1、创建一个字节输入流管道与源文件接通
             is = new FileInputStream("D:\\java168\\1.jpg");
            // 2、创建一个字节输出流管道与目标文件接通。
            os = new FileOutputStream("D:\\java168\\4.jpg");

            System.out.println(10 / 0);

            // 3、创建一个字节数组,负责转移字节数据。
            byte[] buffer = new byte[1024]; // 1KB.
            // 4、从字节输入流中读取字节数据,写出去到字节输出流中。读多少写出去多少。
            int len; // 记住每次读取了多少个字节。
            while ((len = is.read(buffer)) != -1){
                os.write(buffer, 0, len);
            }
            System.out.println("复制完成!!");
        } catch (Exception e) {
            e.printStackTrace();
            System.out.println("报错了");
        } finally {
            // 释放资源的操作
            try {
                if(os != null) os.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
            try {
                if(is != null) is.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
            System.out.println("释放了");
        }
    }
}
image
image

代码写到这里,有很多同学就已经看不下去了。是的,我也看不下去,本来几行代码就写完了的,加上try...catch...finally之后代码多了十几行,而且阅读性并不高。难受....

作业

来做点作业巩固一下吧!!!✏️ 💪

  • 建议也是要求:
    1. 做题之前先审题,标注可能用到的技术
    2. 做题要写注释,然后写代码
    3. 先问自己,再看笔记,实在不知道再问他人