Go的Channel很强大,理解其内在概念会让它更强大

网友投稿 262 2022-06-14


Go 中的通道(channel)机制十分强大,但是理解内在的概念甚至可以使它更强大。实际上,选择缓冲通道或无缓冲通道将改变应用程序的行为和性能。

无缓冲通道

无缓冲通道是在消息发送到通道时需要接收器的通道。声明一个无缓冲通道时,你不需要声明容量。例如:

package main import (

    "sync"     "time" ) func main() {

    c := make(chan string)

    var wg sync.WaitGroup

    wg.Add(2)

    go func() {

        defer wg.Done()

        c <- `foo`     }()

    go func() {

        defer wg.Done()

        time.Sleep(time.Second * 1)

        println(`Message: `+ <-c)

    }()

    wg.Wait()

}

由于没有准备就绪的接收者,第一个goroutine在发送消息foo时将被阻塞。这个说明文档[1]很好地解释了这种行为:

如果容量为零或未设置,则通道将被无缓冲,只有在发送方和接收方都准备就绪时通信才能成功。

这一点,《Effective Go》[2]中描述的也很清晰:

如果通道是无缓冲的,发送者将被阻塞,直到接收者接收到值。

通道的内部描绘可以给我们更多关于此行为的有趣的细节

无缓冲通道内部结构

channel 结构体 在 runtime 包的 chan.go 文件中可以找到。该结构包含与通道缓冲区相关的属性,但是为了说明无缓存的通道,我将省略我们稍后将看到的那些属性。下面是无缓冲通道的示意图:

hchan 结构

通道维护了指向接收方( recvq )和发送方( sendq )列表的指针,由链表 waitq.sudog表示 ,包含指向下一个元素的指针(next)和指向上一个元素的指针(previous),以及与处理 接收方/发送方 的 goroutine 相关的信息。有了这些信息,Go 程序就很容易知道,如果没有了发送方,通道就应该阻塞接收方,反之,没有了接收方,通道就应该阻塞发送方。

下面是我们前面示例的工作流:

通道是用一个空的接收方和发送方列表创建的。

第 16 行,我们的第一个 goroutine 将值 foo 发送到通道。

通道从(缓冲)池中获取一个结构体 sudog,用以表示发送者。这个结构将维护对 goroutine 和值 foo 的引用。

这个发送者现在进入队列(enqueued ) sendq 。

由于“chan send”阻塞,goroutine 进入等待状态。

第 23 行,我们的第二个 goroutine 将读取来自通道的消息。

通道将弹出 sendq 队列,以获取步骤 3 中的等待发送的结构体。

通道将使用 memmove 函数将发送方发送的值(封装装在 sudog 结构中)复制到读取的通道的变量。

现在,我们的第一个 goroutine 可以恢复在第 5 步,并将释放在第 3 步获得的 sudog。

正如我们在工作流中再次看到的,goroutine 必须切换到等待,直到接收器可用为止。但是,如果需要,这种阻塞行为可以通过缓冲通道避免。

缓冲通道内部结构

稍微改动之前的例子,以添加一个缓冲区:

package main import (

    "sync"     "time" ) func main() {

    c := make(chan string, 2)

    var wg sync.WaitGroup

    wg.Add(2)

    go func() {

        defer wg.Done()

        c <- `foo`         c <- `bar`     }()

    go func() {

        defer wg.Done()

        time.Sleep(time.Second * 1)

        println(`Message: `+ <-c)

        println(`Message: `+ <-c)

    }()

    wg.Wait()

}

现在让我们根据这个例子分析结构hchan和与缓冲区相关的字段:

缓冲通道的 hchan 结构

buffer(缓冲)由以下五个属性组成:

qcount 存储缓冲区中元素的当前数量

dataqsiz 存储缓冲区中最大元素的数量

buf 指向一个内存段,该内存段包含缓冲区中元素的最大数量的空间

sendx 存储缓冲区中的位置,以便通道接收下一个元素

recvx 在缓冲区中存储通道返回的下一个元素的位置

通过sendx和recvx,这个缓冲区就像一个循环队列:

通道结构中的循环队列

这个循环队列允许我们在缓冲区中维护一个顺序,而不需要在其中一个元素从缓冲区弹出时不断移动元素。

正如我们在前一节中看到的那样,一旦达到缓冲区的上限,尝试在缓冲区中发送元素的 goroutine 将被移动到发送者列表中,并切换到等待状态。然后,一旦程序读取缓冲区,从缓冲区中返回位于 recvx 位置的元素,将释放等待的 goroutine ,它的值将被推入缓冲中。这种属性使 通道有FIFO(先进先出)[3]的行为。

由于缓冲区大小不足造成的延迟

我们在通道创建期间定义的缓冲区大小可能会极大地影响性能。我使用扇出模式来密集使用通道,以查看不同缓冲区大小的影响。以下是一些压力测试:

package bench import (

    "sync"     "sync/atomic"     "testing" ) func BenchmarkWithNoBuffer(b *testing.B) {

    benchmarkWithBuffer(b, 0)

} func BenchmarkWithBufferSizeOf1(b *testing.B) {

    benchmarkWithBuffer(b, 1)

} func BenchmarkWithBufferSizeEqualsToNumberOfWorker(b *testing.B) {

    benchmarkWithBuffer(b, 5)

} func BenchmarkWithBufferSizeExceedsNumberOfWorker(b *testing.B) {

    benchmarkWithBuffer(b, 25)

} func benchmarkWithBuffer(b *testing.B, size int) {

    for i := 0; i < b.N; i++ {

        c := make(chan uint32, size)

        var wg sync.WaitGroup

        wg.Add(1)

        go func() {

            defer wg.Done()

            for i := uint32(0); i < 1000; i++ {

                c <- i%2             }

            close(c)

        }()

        var total uint32         for w := 0; w < 5; w++ {

            wg.Add(1)

            go func() {

                defer wg.Done()

                for {

                    v, ok := <-c

                    if !ok {

                        break                     }

                    atomic.AddUint32(&total, v)

                }

            }()

        }

        wg.Wait()

    }

}

在我们的基准测试中,一个生产者将在通道中注入一个 100 万个整数元素,而十个消费者将读取他们,并将它们累加到一个名为 total 的结果变量中。

我使用 benchstat 运行他们 10 次来分析结果:

name                                    time/op

WithNoBuffer-8                          306µs ± 3%

WithBufferSizeOf1-8                     248µs ± 1%

WithBufferSizeEqualsToNumberOfWorker-8  183µs ± 4%

WithBufferSizeExceedsNumberOfWorker-8   134µs ± 2%

一个适当大小的缓冲区确实可以使您的应用程序更快!让我们跟踪分析基准测试,以确定延迟在哪里。

追踪延迟

跟踪基准测试将使您访问同步阻塞概要文件,该概要文件显示等待同步原语的 goroutines 阻塞位于何处。Goroutines 在同步过程中花费了 9ms 的时间来等待无缓冲通道的值,而 50 大小的缓冲区只等待 1.9ms:

同步阻塞概要

由于缓冲的存在,来自发送值的等待延迟减小了 5 倍:

同步阻塞概要

我们现在确实证实了我们以前的怀疑。缓冲区的大小对应用程序的性能有重要影响。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Go监控模式(Monitor Pattern)
下一篇:Go刷LeetCode系列:二叉树(3)二叉树路径和(重建二叉树 leetcode)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~