.net core中高效的动态内存管理方案

发布时间：2022-12-25 17:39:08 来源：网络

.

夏天，一束束剑麻，开出的花，如一串串玲珑的 "铃铛 "，在陽光下争艳斗丽地开放。花期最长的要数百日红了，它在烈日下顽强地开出硕大的、玖瑰红的花朵。每天早晨，树下的石凳上，都坐满了晨读的大哥哥大姐姐，这也成了校园的一处风景。

.net core在新增的System.Buffers中引入了一大堆高效内存管理的类，如span和memory、内存池。本文今天这里介绍一个高效动态内存访问方案。

ReadOnlySequenceSegment<T>

在我们读取数据的过程，很多时候会出现如下场景：

不知道数据实际大小
一次性申请大量内存开销太大

此时我们往往会使用动态内存的方案，通过链表的方式串联起来，从而形成逻辑意义上的数据流。如下图所示：

ReadOnlySequenceSegment<T>就是这样一个表示数据流节点的内存模型，它是一个抽象类，包含如下三个元素：

Memory：指向所包含的内存
Next：指向下一个节点
RunningIndex：标志当前节点在整个流的位置

其中Memory和Next还比较容易理解，典型的链表结构。主要难理解的是RunningIndex，他表示该节点在数据流中的Memory起始索引。

一般的来讲，某节点的RunningIndex为其上一个节点的RunningIndex + Memory.Length。加上RunningIndex估计主要是为了快速索引的。

例如：对于如下3快内存 100byte， 200byte， 300byte组成的链表，其RunningIndex分别是0， 100， 200。

另外，在实际的使用过程中，往往是不停的释放链表头部的节点，并且在尾部添加新节点。 RunningIndex表示的索引一般是逻辑意义上的索引，在释放头节点时，一般不用更新其子节点以及后续节点的RunningIndex。

ReadOnlySequence<T>

ReadOnlySequenceSegment<T>虽然能解决我们的动态内存的申请和释放问题，但它往往并不好用，因为很容易出现一段连续的数据被分割在多个节点的情况，在这段不连续的数据里进行查询是非常不便的。

为了解决这个问题，.net core中推出了一个视图类ReadOnlySequence<T>

ReadOnlySequence<T>由两个属性标记：

Start：起始SequenceSegment以及起始索引
End：结尾SequenceSegment以及结尾索引

可以通过foreach遍历各节点的Memory

　　var seq = new ReadOnlySequence<byte>();
　　foreach (ReadOnlyMemory<byte> memory in seq)
　　{
　　}

ReadOnlySequence的主要优势在于，它可以看成一段逻辑意义上的连续内存，常用的函数有：

Slice：对视图数据切片
PositionOf：查询元素的缩影
ToArray：转换成数组

其中的ToArray涉及到大量的数据拷贝，需要谨慎使用。

另外.net core 3.0中还内置了一个SequenceReader，用起来是十分方便的：

private static ReadOnlySpan<byte> CRLF => new byte[] { (byte)'\r', (byte)'\n' };
 
public static void ReadLines(ReadOnlySequence<byte> sequence)
{
    SequenceReader<byte> reader = new SequenceReader<byte>(sequence);
 
    while (!reader.End)
    {
        if (!reader.TryReadToAny(out ReadOnlySpan<byte> line, CRLF, advancePastDelimiter: false))
        {
            // Couldn't find another delimiter
            // ...
        }
 
        if (!reader.IsNext(CRLF, advancePast: true))
        {
            // Not a good CR/LF pair
            // ...
        }
 
        // line is valid, process
        ProcessLine(line);
    }
}