洛谷 5072. 「Ynoi 2015」盼君勿忘

既然去重，则可以考虑每一种数的贡献。
实际上就是这一种数在 \([l,r]\) 的子序列中出现的次数。

对于某种数，设其在区间内出现次数为 \(k\)，则不包含这种树的子序列有 \(2^{r-l+1-k}\) 个。
而这个区间总共的子序列有 \(2^{r-l+1}\) 个。

这样显然不能过。
考虑把贡献次数相同，即出现的子序列个数相同，也即出现次数相同的数放在一起做。
然后莫队。

那么又注意到实际上不同的出现次数只会有 \(O(\sqrt n)\) 种。
因为要最大化不同的出现次数的种数，则显然要从小的出现次数开始选。
这个区间的长度本身是 \(O(n)\) 的，那么根据等差数列求和公式可得最多有 \(O(\sqrt n)\) 种。
然后就 OJBK 辣。

注意每个询问的模数是不同的，那是不是得带个 log 算快速幂呢？
并不，可以预处理模意义下的 \(1,2,2^2,2^3,\ldots,2^T\) 和 \(1,2^T,2^{2T},...,2^{\lfloor\frac nT\rfloor T}\)，其中 \(T\) 为块大小。

如果用 set/unordered_set 来存储不同的出现次数的话常数会很大，需要高超的卡常技巧彩星。
然鹅实际上可以直接用一个 vector 来存，转移询问的时候保留上一次的值，并且不删除无用值，而是转移完之后重构 vector，此时再将无用值删去。
复杂度可以根据莫队的移动次数和上述不同出现次数的结论得到。

代码：

#include <cstdio>
#include <cmath>
#include <cassert>
#include <algorithm>
#include <vector>
using namespace std;

const int BUFF_SIZE = 1 << 20;
char BUFF[BUFF_SIZE],*BB,*BE;
#define gc() (BB == BE ? (BE = (BB = BUFF) + fread(BUFF,1,BUFF_SIZE,stdin),BB == BE ? EOF : *BB++) : *BB++)
template<class T>
inline void read(T &x)
{
    x = 0;
    char ch = 0,w = 0;
    for(;ch < '0' || ch > '9';w |= ch == '-',ch = gc());
    for(;ch >= '0' && ch <= '9';x = (x << 3) + (x << 1) + (ch ^ '0'),ch = gc());
    w && (x = -x);
}

const int N = 1e5;
const int BLK = 318;
const int CNT = 320;
int n,m,a[N + 5];
int block,pos[N + 5];
struct s_query
{
    int l,r,mod,id;
    inline bool operator<(const s_query &o) const
    {
        return pos[l] ^ pos[o.l] ? pos[l] < pos[o.l] : pos[l] & 1 ? r < o.r : r > o.r;
    }
} qry[N + 5];
int pw1[N + 5],pw2[N + 5];
int cnt[N + 5],vis[N + 5];
long long sum[N + 5];
vector<int> d,temp;
int ans[N + 5];
inline void add(int x)
{
    if(cnt[a[x]])
        sum[cnt[a[x]]] -= a[x];
    if(!sum[++cnt[a[x]]] && !vis[cnt[a[x]]])
        vis[cnt[a[x]]] = 1,d.push_back(cnt[a[x]]);
    sum[cnt[a[x]]] += a[x];
}
inline void del(int x)
{
    sum[cnt[a[x]]] -= a[x];
    if(--cnt[a[x]])
    {
        if(!sum[cnt[a[x]]] && !vis[cnt[a[x]]])
            vis[cnt[a[x]]] = 1,d.push_back(cnt[a[x]]);
        sum[cnt[a[x]]] += a[x];
    }
}
inline long long pow2(int x)
{
    return (long long)pw1[x % block] * pw2[x / block];
}
int main()
{
    read(n),read(m),block = BLK,pw1[0] = pw2[0] = 1;
    for(register int i = 1;i <= n;++i)	
        read(a[i]),pos[i] = (i - 1) / block + 1;
    for(register int i = 1;i <= m;++i)
        read(qry[i].l),read(qry[i].r),read(qry[i].mod),qry[i].id = i;
    sort(qry + 1,qry + m + 1);
    for(register int i = 1,l = 1,r = 0;i <= m;++i)
    {
        for(;r < qry[i].r;add(++r));
        for(;l > qry[i].l;add(--l));
        for(;r > qry[i].r;del(r--));
        for(;l < qry[i].l;del(l++));
        for(register int j = 1;j <= block;++j)
            pw1[j] = 2LL * pw1[j - 1] % qry[i].mod;
        for(register int j = 1;j * block <= n;++j)
            pw2[j] = (long long)pw2[j - 1] * pw1[block] % qry[i].mod;
        temp.clear();
        for(register vector<int>::iterator it = d.begin();it != d.end();++it)
            sum[*it] ? (temp.push_back(*it),1) : (vis[*it] = 0);
        d = temp;
        for(register vector<int>::iterator it = d.begin();it != d.end();++it)
            ans[qry[i].id] = (ans[qry[i].id] + (pow2(qry[i].r - qry[i].l + 1) - pow2(qry[i].r - qry[i].l + 1 - *it)) % qry[i].mod * sum[*it]) % qry[i].mod;
        ans[qry[i].id] = (ans[qry[i].id] + qry[i].mod) % qry[i].mod;
    }
    for(register int i = 1;i <= m;++i)
        printf("%d\n",ans[i]);
}

『My guiding star.』

洛谷 5072 「Ynoi 2015」盼君勿忘