Java | 聊一聊编译过程(编译前端 & 编译后端)

  • 时间:
  • 浏览:21
  • 来源:跟我学网络

前言

  • 经过前面几篇文章的积累,相信你已经掌握了 静态的 Class 文件的结构,也理解了虚拟机类加载和字节码执行的 动态过程
  • 这篇文章,我们来聊一聊 Java 的编译过程,你将看到从源码到字节码再到本地代码的整个过程。请点赞,你的点赞和关注真的对我非常重要!

目录

</svg>" width="1354">

1. 经典程序编译原理

将源代码翻译为目标代码的过程,称为编译过程,经典的程序编译过程包含以下过程:

</svg>" width="992">
经典编译原理 示意图
  • 如果将目标代码理解为中间代码,就是狭义上的编译过程。例如*.c文件编译生成*.obj文件的过程,或者*.java文件编译生成*.class文件的过程;

  • 如果将目标代码理解为最终执行的机器代码,那就是广义上的编译过程。那么还包括*.obj文件链接为可执行的*.exe文件的过程,或者*.class解释 / 编译为机器代码的过程;

</svg>" width="992">
经典编译原理 示意图

Java技术下,除非有特定的上下文语境,编译一词通常指的是*.java转换为*.class的过程,这个过程也被称为 编译前端。除此之外,编译一词还可以指运行期即时编译(JIT,Just in Time Compile)或者(静态的)提前编译(AOT,Ahead of Time Compile),这两种编译称为 编译后端

下面,我们整理一下 编译前端 & 编译后端 的要点:


2. 编译前端

编译前端阶段中,最重要的一个编译器就是javac 编译器, 在命令行执行javac命令,其实本质是运行了javac.exe这个应用。Android工程师可能对于 Gradle构建过程更为熟悉,构建过程中有一个Task:compileDebugJavaWithJavac,其实也用到了javac 编译器,编译中间产物路径在build/intermediates/javac/debug/classes

2.1 javac 编译

下面,我们整理javac 编译器的主要处理过程:

</svg>" width="1338">
javac 编译过

延伸文章:

  • 关于注解处理器,请阅读:《Java | 注解处理器原理解析与实践》
  • 关于类加载,请阅读:《Java | 谈谈你对类加载过程的理解》
  • 关于方法调用,请阅读:《Java | 深入理解方法调用的本质(含重载与重写区别)》

2.2 Java 常用语法糖

语法糖 指的是高级语言中的某种语法,这些语法糖在编译时进行解语法糖,转换为无糖语法。这些语法糖大多都是靠编译器实现,而不是依赖字节码或者虚拟机的底层支持。下表总结了部分熟知的语法糖:

</svg>" width="1466">
Java 常见语法糖 示例

延伸文章: - 关于泛型,请阅读:《Java | 关于泛型能问的都在这里了(含Kotlin)》 - 关于内部类,请阅读:《Java | 为什么非静态内部类会持有外部类的引用》 - 关于switch,请阅读:《Java | switch 和 if-else 哪个更高效》


3. 编译后端

在编译后端阶段中,最重要的是 运行期即时编译器(JIT,Just in Time Compiler)和 静态的提前编译器(AOT,Ahead of Time Compiler)。

3.1 解释执行 & 编译执行

根据前面的内容,我们知道编译前端的核心编译产物是:Class 文件。但是对于CPU来说,它是不认得字节码的。在《Java | 为什么 Java 实现了平台无关性》这篇文章里,我们强调了:每种CPU只能“读懂”自身支持的机器语言或者本地代码(native code)

因此,Java 虚拟机在执行字节码时,需要将字节码翻译为当前平台的本地代码,可以分为:解释执行 & 编译执行,具体如下:

</svg>" width="1832">

需要注意的是,并不是所有的Java 虚拟机都采用解释器与编译器并存的运行架构。当触发即时编译时,执行引擎(默认)不会等待即时编译完成,而是先按解释执行的方式继续执行。直到即时编译完成后,方法的入口地址才会被修改。

3.2 即时编译器热点探测

那么,即时编译器是如何探测热点代码的呢?具体来说,探测的热点代码有两种::被多次调用的方法 & 被多次执行的循环体。使用的探测方法有:基于采样 & 基于计数器

</svg>" width="892">

3.3 编译器优化技术

Editting...


4. 总结

  • 编译前端的优化措施主要目的是降低程序员的编码复杂度,提高编码效率。语法糖并不是不是依赖字节码或者虚拟机的底层支持,在编译后会转换为基础的无糖语法。另外,注解处理器相当于编译器的插件,开发人员可以通过它对前端编译施加影响。
  • 编译后端的优化措施主要目的是生成更高效的机器代码,提高运行效率。提前编译在程序运行前编译字节码,相当于提前预热。而即时编译器在运行时动态监控程序运行,探测得热点代码后编译为本地代码,生成的代码更高效,但需要预热期。

参考资料

  • 《深入理解Java虚拟机(第3版本)》(第10、11章)—— 周志明 著
  • 《深入理解Android:Java虚拟机 ART》 —— 邓凡平 著
  • 《深入理解 JVM 字节码》(第4、5章)—— 张亚 著

推荐阅读

  • Java | Object obj = new Object()占用多少字节?
  • Java | 为什么 Java 实现了平台无关性?
  • Java | 带你理解 ServiceLoader 的原理与设计思想
  • Android | 一个进程有多少个 Context 对象(答对的不多)
  • Android | 带你理解 NativeAllocationRegistry 的原理与设计思想
  • Android | 谈一谈 Matrix 与坐标变换
  • Android | 一文带你全面了解 AspectJ 框架
  • 计算机组成原理 | Unicode 和 UTF-8是什么关系?
  • 计算机组成原理 | 为什么浮点数运算不精确?(阿里笔试)

感谢喜欢!你的点赞和关注真的对我非常重要!欢迎关注彭旭锐的Github!

</svg>" width="640">