# Swift 类底层剖析 ## 类的内存结构 ```swift class Person { var age: Int = 0 } class Student: Person { var score: Int = 0 } class Worker: Student { var salary: Int = 0 } let person = Person() person.age = 28 print(Mems.size(ofRef: person)) print(Mems.memStr(ofRef: person)) 32 0x000000010000c400 0x0000000000000003 0x000000000000001c 0x0000000000000000 let student = Student() student.score = 100 print(Mems.size(ofRef: student)) print(Mems.memStr(ofRef: student)) 32 0x000000010000c4b0 0x0000000000000003 0x000000000000001c 0x0000000000000064 let worker = Worker() worker.salary = 1000 print(Mems.size(ofRef: worker)) print(Mems.memStr(ofRef: worker)) 48 0x000000010000c580 0x0000000000000003 0x000000000000001c 0x0000000000000064 0x00000000000003e8 0x00007ff8501c0938 ``` - 内存对齐都是16 Byte 的整数倍 - 一个类内存中,至少占16字节的内存。前8位是类信息、其次的8位是引用计数信息,最后跟属性内存 - 由于类存在继承,所以子类中,前16字节存储类信息和引用计数信息,其次是属性内存,存在继承的话,前面的属性是父类的属性,后面才是自己的属性。 所以: - Person 类的内存: 8 Byte 的类信息 + 8 Byte 引用计数信息 + 8 Byte Int Age 属性 = 24 Byte,由于需要16的倍数,所以是32 Byte - Student 类的内存: 8 Byte 的类信息 + 8 Byte 引用计数信息 + 8 Byte Int Age 属性 + 8 Byte 的 Int Score 属性 = 32 Byte,由于需要16的倍数,所以是32 Byte - Worker 类的内存: 8 Byte 的类信息 + 8 Byte 引用计数信息 + 8 Byte Int Age 属性 + 8 Byte 的 Int Score 属性 + 8 Byte 的 Int Salary 属性 = 40 Byte,由于需要16的倍数,所以是 48 Byte ## 继承 值类型(枚举、结构体)不支持继承,只有类支持继承 没有父类的类,称为基类。Swift 并不像 OC、Java 那样规定:任何类最终都要继承自某个基类(OC 的 NSObject)。 ```swift import Foundation class Person {} class Student: Person {} print(class_getSuperclass(Student.self)!) // Person print(class_getSuperclass(Person.self)!) // _TtCs12_SwiftObject ``` 丛输出可以看出 Swift 还存在一个隐藏基类:`Swift._SwiftObject`,可查看 [Swift 源码](https://github.com/apple/swift/blob/main/stdlib/public/runtime/SwiftObject.h) ## 方法 结构体和枚举是值类型,默认情况下,值类型的属性是不能被自身的实例方法修改。 如果想在方法内修改,需要在 `func` 前加 `mutating` 才可以 ```swift struct Point { var x: Double = 0.0 var y: Double = 0.0 func moveBy(_ delatX: Double, _ delatY: Double) { self.x += delatX self.y += delatY } } var point = Point() point.moveBy(0.2, 0.2) // compiler error Left side of mutating operator isn't mutable: 'self' is immutable ``` 改进 ```swift struct Point { var x: Double = 0.0 var y: Double = 0.0 mutating func moveBy(_ delatX: Double, _ delatY: Double) { self.x += delatX self.y += delatY } } var point = Point() point.moveBy(0.2, 0.4) print(point.x, point.y) // 0.2 0.4 ``` ## 重写方法 `override` 被 class 修饰的类型方法、下标,允许被子类重写 被 static 修饰的类型方法、下标,不允许被子类重写 ```swift class Animal { static var innerValue:Int = 0 class func speak() { print("Animal speak") } class subscript(index: Int) -> Int { set { innerValue = newValue } get { innerValue } } } class Dog: Animal { override class func speak() { super.speak() print("dog is bark") } override class subscript(index: Int) -> Int { set { innerValue = newValue } get { innerValue } } } Animal.speak() // Animal speak Animal[5] = 3 print(Animal[5]) // 3 Dog.speak() // Animal speak dog is bark ``` 但如果将 `Animal` 方法的 `class` 改为 `static`,就无法 `override` 了 ## 重写属性 - 子类不可以将父类的属性改写为存储属性 - 子类可以将父类的属性(存储属性、计算属性)重写为计算属性 - 只能重写 var 属性,不能重写 let 属性 - 重写时,属性名、类型要一致 - 子类重写后的属性权限(读写),不能小于父类属性的权限 - 如果父类属性是只读的,子类重写后的属性要么是只读的,要么是可读可写的 - 如果父类的属性是可读可写的,子类重写后的属性也必须是可读可写的 ## 重写类型属性 - 被 class 修饰的计算类型属性,可以被子类重写 - 被 static 修饰的类型属性(存储、计算),不可以被子类重写 - 可以在子类中为父类属性(除了只读的计算属性、let 属性)增加属性观察器 ```swift class Shape { var radius: Int = 1 { willSet { print("Shape will set radius", newValue) } didSet { print("Shape did set radius", oldValue, radius) } } } class Circle: Shape { override var radius: Int { willSet { print("Cirle will set radius", newValue) } didSet { print("Circle did set radius", oldValue, radius) } } } var circle = Circle() circle.radius = 2 // console Cirle will set radius 2 Shape will set radius 2 Shape did set radius 1 2 Circle did set radius 1 2 ``` 可以看到输出类似 Node 的洋葱模型,willset 从外到里,didset 从里到外。 ## final - 被 final 修饰的方法、属性、下标是禁止被重写的 - 被 final 修饰的类,禁止被继承 ## 多态的实现原理 OC: Runtime C++:虚表 Swift:没有 Runtime,所以多态的实现类似 C++ ```swift class Animal { func speak () { print("Animal speak") } func eat () { print("Animal eat") } func sleep () { print("Animal sleep") } } class Dog: Animal { override func speak() { print("Dog speak") } override func eat() { print("Dog eat") } func run () { print("Dog run") } } var animal = Animal() animal.speak() animal.eat() animal.sleep() animal = Dog() animal.speak() animal.eat() animal.sleep() // console Animal speak Animal eat Animal sleep Dog speak Dog eat Animal sleep ``` 在 `animal.speak()` 处加断点,可以看到 解释: - 汇编84行 `movq 0x9356(%rip), %r13 ` 是将全局变量 `animal` 的地址赋值给 `r13` - 汇编90行 `movq (%r13), %rax` 将 `r13` 处取出内存的前8个字节,赋值给 `rax` - 汇编91行 `callq *0x50(%rax)` ,也就是计算出 `rax + 0x50` 的地址,然后取出8 Byte 出来,也就是 `Dog.speak` 然后调用 - 汇编107行 `callq *0x58(%rax)` ,也就是计算出 `rax + 0x508` 的地址,然后取出8 Byte 出来,也就是 `Dog.eat` 然后调用 - 汇编123行 `callq *0x60(%rax)` ,也就是计算出 `rax + 0x60` 的地址,然后取出8 Byte 出来,也就是 `Animal.sleep` 然后调用 画了张图,也就是说 `rax` 中存放了 Dog 对象内存中的前8个字节,也就是下图的最右侧 核心是上面的内存布局图。结合汇编就知道多态是如何实现的。 总结: **虚函数表**(vtable)是一种用于实现动态多态性的机制,通常用于面向对象的编程语言中(C++ 也是一样)。在 Swift 中,虚函数表用于存储类或协议中方法的地址,以便在运行时进行动态分派。 在 Swift 中,虚函数表的作用是为每个类或协议创建一个表,其中包含了对应方法的地址。当调用对象的方法时,运行时系统会根据对象的实际类型查找对应的虚函数表,然后调用表中存储的方法地址,从而触发特定的实现。 虚函数表在 Swift 中的作用是实现动态分派,使得在运行时根据对象的实际类型确定调用的具体实现。这为 Swift 中的多态性提供了基础,允许相同的方法名称根据对象的类型触发不同的实现,从而实现灵活的对象行为。 ## 类的类型信息存储在哪 说明:同一个类的不同对象,它的类信息是一样的。也就是说不通的对象指针,所指向的类信息内存是同一块。 ```swift var dog1 = Dog() var dog2 = Dog() ``` 存储在全局区。可以利用 MachOView 去查看。 ## 初始化器 ### require - 用 required 修饰的指定初始化器,表明其所有的子类都必须实现该初始化器(通过继承或者重写来实现) - 如果子类重写了 required 初始化器,也必须加上 required,不用加 override ## 可失败初始化器 类、结构体、枚举都可以使用 `init?` 定义可失败初始化器,也可以用 `init!` 来定义可失败初始化器。区别下面会讲 ```swift class Person { var name: String init?(_ name: String) { if name.isEmpty { return nil } self.name = name } } var person1 = Person("") print(person1) // nil var person2 = Person("FantasticLBP") print(person2) // Optional(SwiftDemo.Person) print(person2!) // SwiftDemo.Person ``` 这种设计系统中也存在,比如 Int 的可失败初始化器:`@inlinable public init?(_ description: String)` ```swift var num = Int("12e2") print(num) // nil num = Int("12") print(num) // Optional(12) ``` 注意点: 1. 不允许同时定义参数标签、参数个数、参数类型相同的可失败初始化器和非可失败初始化器。因为在外部调用的时候,不知道到底是使用哪个初始化方法。编译器会报错 `Invalid redeclaration of 'init(_:)'` 2. 可以用 `init!` 来定义隐式解包的可失败初始化器 3. 可失败初始化器可以调用非可失败初始化器,非可失败初始化器调用可失败初始化器需要进行解包。如果直接调用会报错 `A non-failable initializer cannot delegate to failable initializer 'init(_:)' written with 'init?'` ```swift class Person { var name: String init?(_ name: String) { if name.isEmpty { return nil } self.name = name } convenience init() { self.init("")! // 极端 case,设计不合理 } } ``` 非可失败初始化器也可以调用可失败初始化器的隐式解包。 ```swift class Person2 { var name: String init!(_ name: String) { if name.isEmpty { return nil } self.name = name } convenience init() { self.init("") } } ``` 且前面的写法比较危险,假设第一个 `init?` 返回 `nil`,第二个 `convenience init()` 去对 nil 强制解包,则会 crash 4. 可以用一个非可失败初始化器重写一个可失败初始化器,但反过来不行 5. 如果初始化器调用一个可失败初始化器导致初始化失败,那么整个初始化过程都失败,并且之后的代码都停止执行 ```swift class Person { var name: String init?(_ name: String) { if name.isEmpty { return nil } self.name = name } convenience init?() { self.init("") print("我是后面的代码1") print("我是后面的代码2") } } var person1 = Person() print(person1) ``` `init` 初始化失败,后面的 `我是后面的代码1` 均不会执行 ### 可失败初始化器设计哲学 - 安全性优先:Swift 注重安全性,可失败初始化器的设计使得对象的初始化过程更加可靠和安全。通过返回一个可选值来表示初始化成功或失败,可以避免在初始化失败时产生不确定的对象状态 - 错误处理:可失败初始化器与 Swift 的错误处理机制结合使用,使得在初始化失败时能够更好地捕获和处理错误。这种设计哲学强调了对异常情况的处理和错误信息的传递。 - **灵活性**:可失败初始化器提供了一种灵活的初始化机制,允许开发者更加精确地控制对象的初始化过程。这种设计哲学使得对象初始化更加灵活和可定制。 ## 可选链 ```swift var dict:[String: (Int, Int) -> Int] = [ "sum": (+), "minus": (-), "multiple": (*), "divide": (/) ] print(dict["sum"]) // Optional((Function)) var result = dict["divide"]?(40, 20) // 2 print(result!) ``` - 如果可选项为 nil,调用方法、下标、属性失败,结果为 nil - 如果可选项不为 nil,调用方法、下标、属性成功,结果会被包装为可选项 - 如果结果本来是可选项,则不会进行再次包装 - 如果链中任何一个节点为 nil,那么整个链就会调用失败。`var weight = person?.dog?.weight // Int?` - 多个 `?` 可以链接在一起 `var weight = person?.dog?.weight` ## X.self , X.Type, AnyClass - `X.self` 是一个元类型(metadata)的指针,metadata 存放着类型相关信息 - `X.self` 属于 `X.type` 类型 通过汇编探究下背后细节 ```swift class Person { } var person: Person = Person() var personType: Person.Type = Person.self ``` 在第二行代码下断点,可以看到关键的汇编是第8行和第12行: - 第14行可以看到 `rip + 0x89ae = 0x10000396a + 0x89ae = 0x10000C318 `,明显是一个堆地址空间,也就是全局变量 `person` - 第15行可以看到 `rip + 0x89af = 0x100003971 + 0x89af = 0x10000C320 `,明显是一个堆地址空间,也就是全局变量 `personType` - 顺着关键代码找上去,看看 `rax`、`rcx` 的值是哪来的 - 第8行调用函数后可以看到 Xcode 的说明,获取 `metadata`,函数返回值保存到 `rax`,LLDB 打印出为 `0x000000010000c248` - 第11行初始化堆内存后,将地址保存到寄存器 `rax`,LLDB 打印出地址为 `0x0000600000004010`,然后查看 `0x0000600000004010` 对应的对象信息,可以看到内存的前8个字节的值,就是上面得到的 `metadata` 对象的地址值 - `metadata` 结构类似下图右侧 `X.self` 和 `type(of:x)` 效果等价 ```swift class Person { } var person: Person = Person() print(Person.self == type(of: person)) // true ``` ## 元类型的应用 ```swift class Person { required init() {} } class Worker: Person {} class Student: Person {} func createInstance(_ items: [Person.Type]) -> [Person] { var people:[Person] = Array() for item in items { people.append(item.init()) } return people } let student = Student() let studentType = type(of: student) let workerType = Worker.self var people: Array = createInstance([studentType, workerType]) print(people) // [SwiftDemo.Student, SwiftDemo.Worker] ``` ## Self Self 一般用作返回值类型,限定返回值跟方法调用者必须是同一类型(也可以当作参数类型) ```swift protocol Runable { func copy() -> Self } class Person: Runable { required init() {} func copy() -> Self { type(of: self).init() } } class Student: Person { } var person = Person() print(person.copy()) // Person var student = Student() print(student.copy()) // Student ``` ## OC/Swift 运行时 ### 消息派发方式 消息派发方式有3种 #### 直接派发(Direct Dispatch) 会将整个方法的地址,直接硬编码到函数调用的地方。直接派发是最快的,不止是因为需要调用的指令集会更少,并且编译器还能够有很大的优化空间,例如函数内联等,直接派发也被称为静态调用 然而,对于编程来水,直接调用也是最大的局限,而且因为缺乏动态性,所以没有办法支持继承和多态等特性。 #### 函数表派发(Table Dispatch) 函数表派发是编译型语言实现动态行为最常见的方式。寒暑表使用了一个数组来存储类生命的每一个函数的指针。大部分语言把整个称为“Virtual table”(虚函数表、虚表,c++),Swift 里称为 “witness table”。每一个类都会维护一个函数表,里面记录着类所有的函数,如果父类函数被 override 的话,表里面只会保存被 overrride 后的函数。一个子类新添加的函数都会被插入到这个数组的最后,运行时会根据这一个表去决定实际需要被调用的函数。 就像上面[多态实现的原理](#target-anchor)这里讲到的一样 查表是一种简单、易实现、性能可预知的方式。然而,这种派发方式比起直接派发来说,还是慢了一点(从字节码的角度来看,多了两次读和一次跳转。由此带来了性能损耗)。另一个慢的原因在于编译器可能会由于函数内执行的任务,导致无法优化(如果函数带有副作用的话) 这种基于数组的实现,缺陷在于函数表无法拓展。子类会在虚函数表的最后插入新函数,没有位置可以让 extension 安全地插入函数。 #### 消息机制派发(Message Dispatch) 消息机制是调用函数最动态的方式,也是 Cocoa 的基石,催生了 KVO、UIAppearance、CoreData 等,这种运作方式的关键在于开发者可以在运行时改变函数的行为。不止可以通过 swizzling 来改变,甚至可以用 isa-swizzling 修改对象的继承关系,可以在面向对象的基础上实现自定义派发。 ### OC 运行时 主要体现在 - 动态类型(dynamic typing) - 动态绑定(dynamic binding) - 动态装载(dynamic loading) ### Swift 运行时 - 纯 Swift 类的函数调用已经不再是 Objective-C 的运行时发消息,而是类似 c++ 的虚表 vtable,在编译时就确定了调用哪个函数,所以没办法通过 runtime 获取方法、属性 - 而 Swift 为了兼容 Objective-C,凡是继承自 NSObject 的类都会保留其动态性,所以能够通过 runtime 拿到方法。老版本的 swift(如2.2)是编译期隐式的自动帮你加上了 `@objc`,而4.0以后版本的 swift 编译期去掉了隐式特性,必须显示声明 - 不管是 Swift 类,还是继承自 NSObject 的类,只要在属性和方法前面加 `@objc` 关键字,就可以使用 runtime | | 原始定义 | 拓展 | | -------------------- | ---------- | ---------- | | 值类型 | 直接派发 | 直接派发 | | 协议 | 函数表派发 | 直接派发 | | 类 | 函数表派发 | 直接派发 | | 继承自 NSObject 的类 | 函数表派发 | 函数表派发 | - 值类型总是会使用直接派发,简单易懂 - 协议和类的 extension 都会使用直接派发 - NSObject 的 extention 会使用消息机制进行派发 - NSObject 声明作用域的函数都会使函数表进行派发 - 协议里声明的,并且带有默认实现的函数会使用函数表进行派发 修饰符 | final | 直接派发 | | ---------------- | ---------------------- | | dynaminc | 消息机制派发 | | @objc & @nonobjc | 改变在 oc 里的可见性 | | @inline | 告诉编译器可以直接派发 | 有个特殊的组合 final 和 @objc。在标记为 final 的同时,也可以使用 @objc 来让函数可以使用消息机制派发。这么做的结果就是,调用函数的时候会使用直接派发,但也会在 Objective-C 的运行时里注册对应的 selector,函数可以响应 `perform(selector:)` 以及别的 Objective-C 特性,但在直接调用时,又可以有直接派发的性能。