编译前端和编译后端

  • 时间:
  • 浏览:23
  • 来源:跟我学网络
  • 经过前面几篇文章的积累,相信你已经掌握了 静态的 Class 文件的结构,也理解了虚拟机类加载和字节码执行的 动态过程
  • 这篇文章,我们来聊一聊 Java 的编译过程,你将看到从源码到字节码再到本地代码的整个过程。请点赞,你的点赞和关注真的对我非常重要!

将源代码翻译为目标代码的过程,称为编译过程,经典的程序编译过程包含以下过程:

经典编译原理 示意图

  • 如果将 目标代码 理解为**中间代码**,就是狭义上的编译过程。例如 *.c 文件编译生成 *.obj 文件的过程,或者 *.java 文件编译生成 *.class 文件的过程;
  • 如果将 目标代码 理解为最终执行的 机器代码,那就是广义上的编译过程。那么还包括 *.obj 文件链接为可执行的 *.exe 文件的过程,或者 *.class 解释 / 编译为机器代码的过程;

经典编译原理 示意图

在 Java 技术下,除非有特定的上下文语境,编译一词通常指的是 *.java 转换为 *.class 的过程,这个过程也被称为 编译前端。除此之外,编译一词还可以指运行期即时编译(JIT,Just in Time Compile)或者(静态的)提前编译(AOT,Ahead of Time Compile),这两种编译称为 编译后端

下面,我们整理一下 编译前端 & 编译后端 的要点:


编译前端阶段中,最重要的一个编译器就是 javac 编译器, 在命令行执行 javac 命令,其实本质是运行了 javac.exe 这个应用。`Android`工程师可能对于 Gradle 构建过程更为熟悉,构建过程中有一个 Task:compileDebugJavaWithJavac,其实也用到了 javac 编译器,编译中间产物路径在 build/intermediates/javac/debug/classes

2.1 javac 编译

下面,我们整理 javac 编译器 的主要处理过程:

javac 编译过程

延伸文章:

- 关于**注解处理器**,请阅读:[《Java | 注解处理器原理解析与实践》](https://www.jianshu.com/p/993206508d35)

- 关于**类加载**,请阅读:[《Java | 谈谈你对类加载过程的理解》](https://www.jianshu.com/p/993206508d35)

- 关于**方法调用**,请阅读:[《Java | 深入理解方法调用的本质(含重载与重写区别)》](https://www.jianshu.com/p/b5b919f24f82)

2.2 Java 常用语法

语法糖 指的是高级语言中的某种语法,这些语法糖在编译时进行 解语法糖,转换为无糖语法。这些语法糖大多都是靠编译器实现,而不是依赖字节码或者虚拟机的底层支持。下表总结了部分熟知的语法糖:

Java 常见语法糖 示例

延伸文章:

- 关于**泛型**,请阅读:[《Java | 关于泛型能问的都在这里了(含Kotlin)》](https://www.jianshu.com/writer#/notebooks/39010758/notes/75762113)

- 关于**内部类**,请阅读:[《Java | 为什么非静态内部类会持有外部类的引用》](https://www.jianshu.com/p/993206508d35)

- 关于**switch**,请阅读:[《Java | switch 和 if-else 哪个更高效》](https://www.jianshu.com/p/993206508d35)


在编译后端阶段中,最重要的是 运行即时编译器(JIT,Just in Time Compiler)和 静态的提前编译器(AOT,Ahead of Time Compiler)。

3.1 解释执行 & 编译执行

根据前面的内容,我们知道编译前端的核心编译产物是:Class 文件。但是对于`CPU`来说,它是不认得字节码的。在Java | 为什么 Java 实现了平台无关性?里,我们强调了:每种 CPU 只能“读懂”自身支持的机器语言或者本地代码(native code)。

因此,Java 虚拟机在执行字节码时,需要将字节码翻译为当前平台的本地代码,可以分为:解释执行 & 编译执行,具体如下:

需要注意的是,并不是所有的`Java 虚拟机`都采用解释器与编译器并存的运行架构。当触发即时编译时,执行引擎(默认)不会等待即时编译完成,而是先按解释执行的方式继续执行。直到即时编译完成后,方法的入口地址才会被修改。

3.2 即时编译器热点探测

那么,即时编译器是如何探测热点代码的呢?具体来说,探测的热点代码有两种::被多次调用的方法 & 被多次执行的循环体。使用的探测方法有:基于采样 & 基于计数器

3.3 编译器优化技术

Editting...


  • 编译前端的优化措施主要目的是降低程序员的编码复杂度,提高编码效率。语法糖并不是不是依赖字节码或者虚拟机的底层支持,在编译后会转换为基础的无糖语法。另外,注解处理器相当于编译器的插件,开发人员可以通过它对前端编译施加影响。
  • 编译后端的优化措施主要目的是生成更高效的机器代码,提高运行效率。提前编译在程序运行前编译字节码,相当于提前预热。而即时编译器在运行时动态监控程序运行,探测得热点代码后编译为本地代码,生成的代码更高效,但需要预热期。

参考资料

  • 《深入理解Java虚拟机(第3版本)》(第10、11章)—— 周志明 著
  • 《深入理解Android:Java虚拟机 ART》 —— 邓凡平 著
  • 《深入理解 JVM 字节码》(第4、5章)—— 张亚 著

推荐阅读

Java | 为什么 Java 实现了平台无关性?

- [Java | Object obj = new Object()占用多少字节?](https://www.jianshu.com/p/70557f0100ff)

- [Java | 带你理解 ServiceLoader 的原理与设计思想](https://www.jianshu.com/p/a18499b5df1c)

- [Android | 一个进程有多少个 Context 对象(答对的不多)](https://www.jianshu.com/p/51d63a1ffb95)

- [Android | 带你理解 NativeAllocationRegistry 的原理与设计思想](https://www.jianshu.com/p/6f042f9e47a8)

- [Android | 谈一谈 Matrix 与坐标变换](https://www.jianshu.com/p/d61a785af776)

- [Android | 一文带你全面了解 AspectJ 框架](https://www.jianshu.com/p/266e5a918c84)

- [计算机组成原理 | Unicode 和 UTF-8是什么关系?](https://www.jianshu.com/p/6274b13e7982)

- [计算机组成原理 | 为什么浮点数运算不精确?(阿里笔试)](https://www.jianshu.com/p/2adb8fe74987)

感谢喜欢!你的点赞和关注真的对我非常重要!欢迎关注[彭旭锐](https://github.com/pengxurui)的Github!