noham/knowledge-kit

Fork 0

mirror of https://github.com/NohamR/knowledge-kit.git synced 2026-05-24 20:00:37 +00:00

Files

杭城小刘 851797d133 docs: clang 插件开发

2024-04-27 13:01:58 +08:00

20 KiB

Raw Blame History

Swift 类底层剖析

类的内存结构

class Person {
    var age: Int = 0
}

class Student: Person {
    var score: Int = 0
}

class Worker: Student {
    var salary: Int = 0
}

let person = Person()
person.age = 28
print(Mems.size(ofRef: person))	 	
print(Mems.memStr(ofRef: person))

32
0x000000010000c400 0x0000000000000003 
0x000000000000001c 0x0000000000000000

let student = Student()
student.score = 100
print(Mems.size(ofRef: student))
print(Mems.memStr(ofRef: student))
32
0x000000010000c4b0 0x0000000000000003 
0x000000000000001c 0x0000000000000064

let worker = Worker()
worker.salary = 1000
print(Mems.size(ofRef: worker))
print(Mems.memStr(ofRef: worker))
48
0x000000010000c580 0x0000000000000003 
0x000000000000001c 0x0000000000000064 0x00000000000003e8 0x00007ff8501c0938

内存对齐都是16 Byte 的整数倍
一个类内存中，至少占16字节的内存。前8位是类信息、其次的8位是引用计数信息，最后跟属性内存
由于类存在继承，所以子类中，前16字节存储类信息和引用计数信息，其次是属性内存，存在继承的话，前面的属性是父类的属性，后面才是自己的属性。

所以：

Person 类的内存： 8 Byte 的类信息 + 8 Byte 引用计数信息 + 8 Byte Int Age 属性 = 24 Byte，由于需要16的倍数，所以是32 Byte
Student 类的内存： 8 Byte 的类信息 + 8 Byte 引用计数信息 + 8 Byte Int Age 属性 + 8 Byte 的 Int Score 属性 = 32 Byte，由于需要16的倍数，所以是32 Byte
Worker 类的内存： 8 Byte 的类信息 + 8 Byte 引用计数信息 + 8 Byte Int Age 属性 + 8 Byte 的 Int Score 属性 + 8 Byte 的 Int Salary 属性 = 40 Byte，由于需要16的倍数，所以是 48 Byte

继承

值类型（枚举、结构体）不支持继承，只有类支持继承

没有父类的类，称为基类。Swift 并不像 OC、Java 那样规定：任何类最终都要继承自某个基类（OC 的 NSObject）。

import Foundation
class Person {}
class Student: Person {}
print(class_getSuperclass(Student.self)!)		// Person
print(class_getSuperclass(Person.self)!) 		// _TtCs12_SwiftObject

丛输出可以看出 Swift 还存在一个隐藏基类：Swift._SwiftObject，可查看 Swift 源码

方法

结构体和枚举是值类型，默认情况下，值类型的属性是不能被自身的实例方法修改。

如果想在方法内修改，需要在 func 前加 mutating 才可以

struct Point {
    var x: Double = 0.0
    var y: Double = 0.0
    func moveBy(_ delatX: Double, _ delatY: Double) {
        self.x += delatX
        self.y += delatY
    }
}
var point = Point()
point.moveBy(0.2, 0.2)
// compiler error
Left side of mutating operator isn't mutable: 'self' is immutable

改进

struct Point {
    var x: Double = 0.0
    var y: Double = 0.0
    mutating func moveBy(_ delatX: Double, _ delatY: Double) {
        self.x += delatX
        self.y += delatY
    }
}
var point = Point()
point.moveBy(0.2, 0.4)
print(point.x, point.y)
// 0.2 0.4

重写方法

override

被 class 修饰的类型方法、下标，允许被子类重写

被 static 修饰的类型方法、下标，不允许被子类重写

class Animal {
    static var innerValue:Int = 0
    class func speak() {
        print("Animal speak")
    }
    
    class subscript(index: Int) -> Int {
        set {
            innerValue = newValue
        }
        get {
            innerValue
        }
    }
}

class Dog: Animal {
    override class func speak() {
        super.speak()
        print("dog is bark")
    }
    override class subscript(index: Int) -> Int {
        set {
            innerValue = newValue
        }
        get {
            innerValue
        }
    }
}

Animal.speak() // Animal speak
Animal[5] = 3
print(Animal[5]) // 3
Dog.speak() // Animal speak dog is bark

但如果将 Animal 方法的 class 改为 static，就无法 override 了

重写属性

子类不可以将父类的属性改写为存储属性
子类可以将父类的属性（存储属性、计算属性）重写为计算属性
只能重写 var 属性，不能重写 let 属性
重写时，属性名、类型要一致
子类重写后的属性权限（读写），不能小于父类属性的权限
- 如果父类属性是只读的，子类重写后的属性要么是只读的，要么是可读可写的
- 如果父类的属性是可读可写的，子类重写后的属性也必须是可读可写的

重写类型属性

被 class 修饰的计算类型属性，可以被子类重写
被 static 修饰的类型属性（存储、计算），不可以被子类重写
可以在子类中为父类属性（除了只读的计算属性、let 属性）增加属性观察器

class Shape {
    var radius: Int = 1 {
        willSet {
            print("Shape will set radius", newValue)
        }
        didSet {
            print("Shape did set radius", oldValue, radius)
        }
    }
}
class Circle: Shape {
    override var radius: Int {
        willSet {
            print("Cirle will set radius", newValue)
        }
        didSet {
            print("Circle did set radius", oldValue, radius)
        }
    }
}
var circle = Circle()
circle.radius = 2
// console
Cirle will set radius 2
Shape will set radius 2
Shape did set radius 1 2
Circle did set radius 1 2

可以看到输出类似 Node 的洋葱模型，willset 从外到里，didset 从里到外。

final

被 final 修饰的方法、属性、下标是禁止被重写的
被 final 修饰的类，禁止被继承

多态的实现原理

OC： Runtime

C++：虚表

Swift：没有 Runtime，所以多态的实现类似 C++

class Animal {
    func speak () {
        print("Animal speak")
    }
    func eat () {
        print("Animal eat")
    }
    func sleep () {
        print("Animal sleep")
    }
}

class Dog: Animal {
    override func speak() {
        print("Dog speak")
    }
    override func eat() {
        print("Dog eat")
    }
    func run () {
        print("Dog run")
    }
}

var animal = Animal()
animal.speak()
animal.eat()
animal.sleep()

animal = Dog()
animal.speak()
animal.eat()
animal.sleep()
// console
Animal speak
Animal eat
Animal sleep
Dog speak
Dog eat
Animal sleep

在 animal.speak() 处加断点，可以看到

解释：

汇编84行 movq 0x9356(%rip), %r13 是将全局变量 animal 的地址赋值给 r13
汇编90行 movq (%r13), %rax 将 r13 处取出内存的前8个字节，赋值给 rax
汇编91行 callq *0x50(%rax) ，也就是计算出 rax + 0x50 的地址，然后取出8 Byte 出来，也就是 Dog.speak 然后调用
汇编107行 callq *0x58(%rax) ，也就是计算出 rax + 0x508 的地址，然后取出8 Byte 出来，也就是 Dog.eat 然后调用
汇编123行 callq *0x60(%rax) ，也就是计算出 rax + 0x60 的地址，然后取出8 Byte 出来，也就是 Animal.sleep 然后调用

画了张图，也就是说 rax 中存放了 Dog 对象内存中的前8个字节，也就是下图的最右侧

核心是上面的内存布局图。结合汇编就知道多态是如何实现的。

总结： 虚函数表（vtable）是一种用于实现动态多态性的机制，通常用于面向对象的编程语言中（C++ 也是一样）。在 Swift 中，虚函数表用于存储类或协议中方法的地址，以便在运行时进行动态分派。

在 Swift 中，虚函数表的作用是为每个类或协议创建一个表，其中包含了对应方法的地址。当调用对象的方法时，运行时系统会根据对象的实际类型查找对应的虚函数表，然后调用表中存储的方法地址，从而触发特定的实现。

虚函数表在 Swift 中的作用是实现动态分派，使得在运行时根据对象的实际类型确定调用的具体实现。这为 Swift 中的多态性提供了基础，允许相同的方法名称根据对象的类型触发不同的实现，从而实现灵活的对象行为。

类的类型信息存储在哪

说明：同一个类的不同对象，它的类信息是一样的。也就是说不通的对象指针，所指向的类信息内存是同一块。

var dog1 = Dog()
var dog2 = Dog()

存储在全局区。可以利用 MachOView 去查看。

初始化器

require

用 required 修饰的指定初始化器，表明其所有的子类都必须实现该初始化器（通过继承或者重写来实现）
如果子类重写了 required 初始化器，也必须加上 required，不用加 override

可失败初始化器

类、结构体、枚举都可以使用 init? 定义可失败初始化器，也可以用 init! 来定义可失败初始化器。区别下面会讲

class Person {
    var name: String
    init?(_ name: String) {
        if name.isEmpty {
            return nil
        }
        self.name = name
    }
}

var person1 = Person("")
print(person1) // nil
var person2 = Person("FantasticLBP")
print(person2)	// Optional(SwiftDemo.Person)
print(person2!)	// SwiftDemo.Person

这种设计系统中也存在，比如 Int 的可失败初始化器：@inlinable public init?(_ description: String)

var num = Int("12e2")
print(num)	// nil
num = Int("12")
print(num) // Optional(12)

注意点：

不允许同时定义参数标签、参数个数、参数类型相同的可失败初始化器和非可失败初始化器。因为在外部调用的时候，不知道到底是使用哪个初始化方法。编译器会报错 Invalid redeclaration of 'init(_:)'
可以用 init! 来定义隐式解包的可失败初始化器

可失败初始化器可以调用非可失败初始化器，非可失败初始化器调用可失败初始化器需要进行解包。如果直接调用会报错 A non-failable initializer cannot delegate to failable initializer 'init(_:)' written with 'init?'

class Person {
    var name: String
    init?(_ name: String) {
        if name.isEmpty {
            return nil
        }
        self.name = name
    }
    convenience init() {
        self.init("")! // 极端 case，设计不合理
    }
}

非可失败初始化器也可以调用可失败初始化器的隐式解包。

class Person2 {
    var name: String
    init!(_ name: String) {
        if name.isEmpty {
            return nil
        }
        self.name = name
    }
    convenience init() {
        self.init("")
    }
}

且前面的写法比较危险，假设第一个 init? 返回 nil，第二个 convenience init() 去对 nil 强制解包，则会 crash

可以用一个非可失败初始化器重写一个可失败初始化器，但反过来不行

如果初始化器调用一个可失败初始化器导致初始化失败，那么整个初始化过程都失败，并且之后的代码都停止执行

class Person {
    var name: String
    init?(_ name: String) {
        if name.isEmpty {
            return nil
        }
        self.name = name
    }
    convenience init?() {
        self.init("")
        print("我是后面的代码1")
        print("我是后面的代码2")
    }
}

var person1 = Person()
print(person1)

init 初始化失败，后面的 我是后面的代码1 均不会执行

可失败初始化器设计哲学

安全性优先：Swift 注重安全性，可失败初始化器的设计使得对象的初始化过程更加可靠和安全。通过返回一个可选值来表示初始化成功或失败，可以避免在初始化失败时产生不确定的对象状态
错误处理：可失败初始化器与 Swift 的错误处理机制结合使用，使得在初始化失败时能够更好地捕获和处理错误。这种设计哲学强调了对异常情况的处理和错误信息的传递。
灵活性：可失败初始化器提供了一种灵活的初始化机制，允许开发者更加精确地控制对象的初始化过程。这种设计哲学使得对象初始化更加灵活和可定制。

可选链

var dict:[String: (Int, Int) -> Int] = [
    "sum": (+),
    "minus": (-),
    "multiple": (*),
    "divide": (/)
]
print(dict["sum"]) // Optional((Function))
var result = dict["divide"]?(40, 20) // 2
print(result!)

如果可选项为 nil，调用方法、下标、属性失败，结果为 nil
如果可选项不为 nil，调用方法、下标、属性成功，结果会被包装为可选项
如果结果本来是可选项，则不会进行再次包装
如果链中任何一个节点为 nil，那么整个链就会调用失败。var weight = person?.dog?.weight // Int?
多个 ? 可以链接在一起 var weight = person?.dog?.weight

X.self , X.Type, AnyClass

X.self 是一个元类型（metadata）的指针，metadata 存放着类型相关信息
X.self 属于 X.type 类型

通过汇编探究下背后细节

class Person { }
var person: Person = Person()
var personType: Person.Type = Person.self

在第二行代码下断点，可以看到关键的汇编是第8行和第12行：

第14行可以看到 rip + 0x89ae = 0x10000396a + 0x89ae = 0x10000C318 ，明显是一个堆地址空间，也就是全局变量 person
第15行可以看到 rip + 0x89af = 0x100003971 + 0x89af = 0x10000C320 ，明显是一个堆地址空间，也就是全局变量 personType
顺着关键代码找上去，看看 rax、rcx 的值是哪来的
第8行调用函数后可以看到 Xcode 的说明，获取 metadata，函数返回值保存到 rax，LLDB 打印出为 0x000000010000c248
第11行初始化堆内存后，将地址保存到寄存器 rax，LLDB 打印出地址为 0x0000600000004010，然后查看 0x0000600000004010 对应的对象信息，可以看到内存的前8个字节的值，就是上面得到的 metadata 对象的地址值
metadata 结构类似下图右侧

X.self 和 type(of:x) 效果等价

class Person { }
var person: Person = Person()
print(Person.self == type(of: person)) // true

元类型的应用

class Person {
    required init() {}
}
class Worker: Person {}
class Student: Person {}
func createInstance(_ items: [Person.Type]) -> [Person] {
    var people:[Person] = Array<Person>()
    for item in items {
        people.append(item.init())
    }
    return people
}

let student = Student()
let studentType = type(of: student)
let workerType = Worker.self
var people: Array<Person> = createInstance([studentType, workerType])
print(people)	// [SwiftDemo.Student, SwiftDemo.Worker]

Self

Self 一般用作返回值类型，限定返回值跟方法调用者必须是同一类型（也可以当作参数类型）

protocol Runable {
    func copy() -> Self
}

class Person: Runable {
    required init() {}
    func copy() -> Self {
        type(of: self).init()
    }
}

class Student: Person { }

var person = Person()
print(person.copy()) // Person
var student = Student()
print(student.copy()) // Student

OC/Swift 运行时

消息派发方式

消息派发方式有3种

直接派发（Direct Dispatch）

会将整个方法的地址，直接硬编码到函数调用的地方。直接派发是最快的，不止是因为需要调用的指令集会更少，并且编译器还能够有很大的优化空间，例如函数内联等，直接派发也被称为静态调用

然而，对于编程来水，直接调用也是最大的局限，而且因为缺乏动态性，所以没有办法支持继承和多态等特性。

函数表派发（Table Dispatch）

函数表派发是编译型语言实现动态行为最常见的方式。寒暑表使用了一个数组来存储类生命的每一个函数的指针。大部分语言把整个称为“Virtual table”（虚函数表、虚表，c++），Swift 里称为 “witness table”。每一个类都会维护一个函数表，里面记录着类所有的函数，如果父类函数被 override 的话，表里面只会保存被 overrride 后的函数。一个子类新添加的函数都会被插入到这个数组的最后，运行时会根据这一个表去决定实际需要被调用的函数。

就像上面多态实现的原理这里讲到的一样

查表是一种简单、易实现、性能可预知的方式。然而，这种派发方式比起直接派发来说，还是慢了一点（从字节码的角度来看，多了两次读和一次跳转。由此带来了性能损耗）。另一个慢的原因在于编译器可能会由于函数内执行的任务，导致无法优化（如果函数带有副作用的话）

这种基于数组的实现，缺陷在于函数表无法拓展。子类会在虚函数表的最后插入新函数，没有位置可以让 extension 安全地插入函数。

消息机制派发（Message Dispatch）

消息机制是调用函数最动态的方式，也是 Cocoa 的基石，催生了 KVO、UIAppearance、CoreData 等，这种运作方式的关键在于开发者可以在运行时改变函数的行为。不止可以通过 swizzling 来改变，甚至可以用 isa-swizzling 修改对象的继承关系，可以在面向对象的基础上实现自定义派发。

OC 运行时

主要体现在

动态类型（dynamic typing）
动态绑定（dynamic binding）
动态装载（dynamic loading）

Swift 运行时

纯 Swift 类的函数调用已经不再是 Objective-C 的运行时发消息，而是类似 c++ 的虚表 vtable，在编译时就确定了调用哪个函数，所以没办法通过 runtime 获取方法、属性
而 Swift 为了兼容 Objective-C，凡是继承自 NSObject 的类都会保留其动态性，所以能够通过 runtime 拿到方法。老版本的 swift（如2.2）是编译期隐式的自动帮你加上了 @objc，而4.0以后版本的 swift 编译期去掉了隐式特性，必须显示声明
不管是 Swift 类，还是继承自 NSObject 的类，只要在属性和方法前面加 @objc 关键字，就可以使用 runtime

	原始定义	拓展
值类型	直接派发	直接派发
协议	函数表派发	直接派发
类	函数表派发	直接派发
继承自 NSObject 的类	函数表派发	函数表派发

值类型总是会使用直接派发，简单易懂
协议和类的 extension 都会使用直接派发
NSObject 的 extention 会使用消息机制进行派发
NSObject 声明作用域的函数都会使函数表进行派发
协议里声明的，并且带有默认实现的函数会使用函数表进行派发

修饰符

final	直接派发
dynaminc	消息机制派发
@objc & @nonobjc	改变在 oc 里的可见性
@inline	告诉编译器可以直接派发

有个特殊的组合 final 和 @objc。在标记为 final 的同时，也可以使用 @objc 来让函数可以使用消息机制派发。这么做的结果就是，调用函数的时候会使用直接派发，但也会在 Objective-C 的运行时里注册对应的 selector，函数可以响应 perform(selector:) 以及别的 Objective-C 特性，但在直接调用时，又可以有直接派发的性能。

20 KiB Raw Blame History Unescape Escape