rprmq2

First Post:

2023-06-14

Last Update:

2023-10-05

Word Count:

1.9k

Read Time:

6 min

Page View: loading...

本文创建于 2022-03-16 21:37:56，原先内容已基本改动殆尽（有 git 在记录！）。

为什么不先看看 rprmq1 呢？

很神奇啊，一年前有人把这题的一个弱卡常版本搬到了校内赛，然后我被垃圾 OJ 评测机创了很久，一年之后又回来被创了。

感谢 lxl 的 std，以及另外一位 lxl 写的跟 std 一样快的代码。

思路

对时间分块，设块长为，然后考虑这个块之前的操作以及这个块内的操作。

对于一整个块的操作，它们将平面分割为了个操作不同的矩形，而每个矩形内的操作是相同的。所以我们令每个矩形内的最大值表示这个矩形，那么块内变为一个的子问题。

那么接下来块前的操作即为处理出的子问题矩形。

块间处理

~~会 rprmq1 最好，虽然我写这句话的时候还没看过 rprmq1。~~

按照轴顺序操作，对于轴上同一层的矩形，我们按照轴的顺序遍历里面的操作，然后这一层所有矩形的最大值即为这若干修改操作的历史最大值。

超出这一层之后，我们将历史最值重新设为当前值，并继续下一层的操作，使用线段树维护即可。

如果直接这样做的话，这颗线段树的大小是的，查询次个区间是的，非常劣。

考虑把线段树做成这样：

graph TD
    1,n -.-> 1,y1-1
    1,n -.-> y1,y2-1
    1,n -.-> y2,y3-1
    1,n -.-> yxn,yxn-1
    subgraph 询问点
        1,y1-1
        y1,y2-1
        y2,y3-1
        yxn,yxn-1
    end
    1,y1-1 -.-> 1,1
    1,y1-1 -.-> y1-1,y1-1
    y1,y2-1 -.-> y1,y1
    y1,y2-1 -.-> y2-1,y2-1
    y2,y3-1 -.-> y2,y2
    y2,y3-1 -.-> y3-1,y3-1
    yxn,yxn-1 -.-> yxn,yxn
    yxn,yxn-1 -.-> n,n

我们把线段树分为两层，上层线段树每个叶子表示一个块，这样这上面的结点数就是的了，然后每次整体查询的时候只需要遍历即可，复杂度降为。

修改的时候需要用到下层的线段树（在上层的每个叶子的区间内开正常的线段树），所以是的。

块内处理

使用 KDT/四分树/离线分治都可以做到。

~~实测分治以外的做法都过不去，分治不会。~~

过了，但基本没过。

强行分治可以直接对着 KDT 的结构将所有操作一次性下传，但是好像不太好写，主要是还需要按照结构把信息重新上传回来。我看了看 std 好像不是这样的。~~所以能不能教教分治？~~

复杂度瞎糊

块间长这样：

块内长这样：

~~看起来很好，但实际上块内常数老大了跑的非常拉。~~

然后在的时候有最优。

空间复杂度是线性的，故本题空间卡的略紧。

实现

首先你要知道这道题在 Ynoi 里一方面算不太卡常的，一方面算非常卡常的。

主要是如果两部分在大方向上写的跟 std 一样的话应该不太难过，但是如果只是跟 std 时间复杂度一样的话那就非常悲伤，很多细枝末节的实现可以改但是没有哪个比较有效的。

如果您会分治法的话请大胆尝试此题，~~所以能不能教教分治~~，否则的话不太建议，当然也能硬卡。

以下都是个人经验，仅供参考。

~~不过我寻思真的会有人会大力卡这题的常么？~~

块间

~~标算的 pushdown 好厉害看不懂。~~

那肯定要写 zkw 线段树的对吧。

我们注意到我们只关心上层线段树的历史最值，所以下层线段树只需要维护当前的最值和加标记即可，每次对下层操作的时候对上层的对应叶子更新一下历史最值。这个非常重要，写出来一下就少了运行用时。

清空线段树的时候合理地使用 memset 可以快不少。

虽然看不懂标算的 pushdown，但是我另外有一个神秘的优化，每次下传的时候将当前的历史最大加标记清掉：

struct Unode{
    ll add,mx,_add,_mx;
    void push(Unode &a,Unode &b){
        if(_add){
            cmax(a._add,a.add+_add);
            cmax(a._mx,a.mx+_add);
            cmax(b._add,b.add+_add);
            cmax(b._mx,b.mx+_add);
            _add=0;
        }
        if(add){
            a.add+=add;a.mx+=add;
            b.add+=add;b.mx+=add;
            add=0;
        }
    }
};

比较搞笑但是确实比较高效。

将历史值重置可以直接暴力扫整个线段树，是的。

这部分的实现可以很好地锻炼模板泛型的使用，因为空间卡的比较紧，建议写一个简易的 allocator 分配内存，当然要是不想研究高阶语法的话直接写两颗线段树也行。

~~好像可以~~ 再精细实现一点，对于上层线段树把叶子抠出来，其他的结点不需要记录最值标记。

upd 2023/8/24: 我写出来了，，起飞了！正在考虑连同空间一起优化掉！

块内

分治应当是很快的，但是不会啊！所以能不能教教分治！

考虑这是一个满平面，所以 KDT 和四分树的结构是一样的了，爱写哪个都行，我写的四分树。

然后为了内存连续性，需要写成动态开点的，保证在递归结构上相近的结点在内存上也相近。

对于长宽小于的矩形转为暴力可以快不少，个人在洛谷上尝试得到了（不知道为什么洛谷的机子跟我的机子差距巨大）。

不知道为什么我写了一个固定一次 build 然后每次循环清空的跑不过每次都重新递归 build 的。

这部分虽然常数很大，但是没甚么优化空间，不建议在尝试这部分的各种实现上浪费时间。因为空间结构比较神秘，递归改迭代似乎效果不好。

其他

块长我发现（共块）比和快了，不知道是不是因为评测机波动毕竟这题时限挺大的。这个不建议大家参考，要参考就参考调块长时需要精确到个位数。

注意每次对所有询问按照轴方向排序不要使用 set 这样的 STL 或者暴力 sort（当然有可能手写平衡树会快），不如直接带着编号提前排序好，然后暴力遍历的时候判一下编号对不对。

其他的话，记得写快读快输然后调块长。

如何知道还要卡多少常

建议大家先去 Codeforces 上的弱化版交，如果你的代码在使用的块长下（洛谷代码不做改动的在 CF 上交）能够跑到以内再考虑交洛谷。

洛谷没过可以加一个卡时返回当前处理了多少块，注意洛谷对 RE 的返回值是模的，反正总共也没有块，如果前面几十块都做不完那还是别搞了。

CODE

好像 lxl 不喜欢题解放代码，所以有需要的话可以找我要。

包括 std 以及另外一位 lxl 写的跟 std 一样快的代码也行。

≡