本文将按照Java源代码从编译到执行的过程,进行一步一步的分析。
Java程序编译到运行过程:
一.源代码编写
首先编写java源代码程序,文件扩展名:.java。
//MainApp.java
public class MainApp {
public static void main(String[] args) {
Animal animal = new Animal("SW");
animal.printName();
}
}
//Animal.java
public class Animal {
public String name;
public Animal(String name) {
this.name = name;
}
public void printName() {
System.out.println("printName:Name-" + this.name);
}
}
二.编译成字节码(ByteCode)
在命令行模式中,输入命令:javac 源文件名.java
,会对源代码进行编译,最终生成字节码文件(.class文件);
(1)编译过程
Java编译器在编译一个Java类时,会检查该类所依赖的类是否存在且已被编译:
- 如果存在,但是未被编译:Java编译器会先编译这个被依赖的类,然后引用
- 如果存在,而且已经被编译,Java编译器会直接引用
- 如果Java编译器在指定目录下找不到这个被依赖类所对应的.java or .class,就会报
cant find symbol
的错误
(2) 机器码与字节码
a.机器码
机器码是CPU可直接读取并运行的机器指令,运行速度非常快,且依赖于具体的硬件。
b.字节码
字节码是一种中间码,它比机器码更抽象,需要编译后才能成为机器码。字节码与硬件环境无关。
(3) 字节码包含部分
字节码包含以下部分组成:
- 结构信息 包括 class 文件格式版本号及各部分的数量与大小的信息。
- 元数据 对应于 Java 源码中声明与常量的信息。包含类/继承的超类/实现的接口的声明信息、域与方法声明信息和常量池。
- 方法信息 对应 Java 源码中语句和表达式对应的信息。包含字节码、异常处理器表、求值栈与局部变量区大小、求值栈的类型记录、调试符号信息。
使用javap
查看:
三.字节码由JVM解释执行
编译完成后,如果没有报错信息,输入命令:java MainApp
,JVM 对class字节码文件进行解释运行,执行时不需要添加.class扩展名。
Java类运行时,分为两个过程:
- 类的加载(在加载过程中,
JIT编译器
会将字节码编译成机器码) - 类的执行
1.类的加载:
(1)加载时编译
在加载前,JVM中的JIT编译器
会将字节码先编译:
(2)懒加载
类采用懒加载(Lazy Loading)的方式。
即,JVM会在类即将要被第一次使用时,才加载它(此后一直保留在内存中)。而不是一开始,就把程序中的所有类都加载到内存中。
(3)加载机制
JVM 的类加载是通过 ClassLoader 及其子类来完成的,类的加载顺序
和加载检查顺序
如下所示:
a.Bootstrap ClassLoader
负责加载$JAVA_HOME中jre/lib/rt.jar里所有的 class,由 C++ 实现,不是 ClassLoader 子类。
b.Extension ClassLoader
负责加载Java平台中扩展功能的一些 jar 包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目录下的 jar 包。
c.App ClassLoader
负责记载 classpath 中指定的 jar 包及目录中 class。
d.Custom ClassLoader
属于应用程序根据自身需要自定义的 ClassLoader,如 Tomcat、jboss 都会根据 J2EE 规范自行实现 ClassLoader。
加载过程中会先检查类是否被已加载,检查顺序是自底向上,从 Custom ClassLoader 到 BootStrap ClassLoader 逐层检查,只要某个 Classloader 已加载就视为已加载此类,保证此类只所有 ClassLoade r加载一次。而加载的顺序是自顶向下,也就是由上层来逐层尝试加载此类。
2.类的执行
(1)javac
编译得到 MainApp.class 文件后
(2)输入java AppMain
系统会启动一个JVM进程,JVM进程从ClassPath路径中找到一个名为 MainApp.class 的二进制文件。
(3)加载MainApp类
将 MainApp 类的字节码通过JIT编译器
编译后,加载到运行时的代码区
(4)JVM 找到 AppMain 的主函数入口,开始执行main函数。
(5)执行Animal animal = new Animal("SW");
- JVM发现,此时代码区中并没有
Animal
类。因此将Animal
类的字节码通过JIT编译器
编译后,存储于运行时的代码区。 - 在堆(Heap)中为一个新的
Animal
对象分配空间,animal 指向这块在堆中的内存区域
(6)执行animal.printName()animal.printName();
- JVM根据 animal 引用,找到在堆中的 Animal 对象,然后根据该对象定位到方法区中Animal 类的类型信息的方法表,获得printName()函数的字节码地址。
- 执行printName()函数