#556. 词频统计

    ID: 556 传统题 1000ms 256MiB 尝试: 2 已通过: 1 难度: 2 上传者: 标签>CCF CSP认证第 33 次CCF CSP软件能力认证基础算法模拟

词频统计

问题描述

在学习了文本处理后,小 PP 对英语书中的 nn 篇文章进行了初步整理。 具体来说,小 PP 将所有的英文单词都转化为了整数编号。假设这 nn 篇文章中共出现了 mm 个不同的单词,则把它们从 11mm 进行编号。

这样,每篇文章就简化为了一个整数序列,其中每个数都在 11mm 范围内。现给出小 PP 处理后的 nn 篇文章,对于每个单词 ii1im1\le i\le m),试统计:

  • 单词 ii 出现在了多少篇文章中?
  • 单词 ii 在全部文章中总共出现了几次?

输入格式

输入共 n+1n+1 行。

第一行包含两个正整数 nnmm,分别表示文章篇数和单词编号上限。

i+1i+1 行表示第 ii 篇文章,格式为若干以空格分隔的整数:第一个整数为 lil_i,表示第 ii 篇文章的长度(单词个数);接下来 lil_i 个整数表示对应的单词编号序列(每个整数均在 11mm 范围内)。

所有测试数据满足:

0<n,m100,1li100 0 < n, m \le 100,1 \le l_i \le 100

每篇文章至少包含 11 个单词且不超过 100100 个单词。

输出格式

输出共 mm 行。第 ii 行输出两个整数 xix_iyiy_i,用空格分隔,其中:

  • xix_i 表示共有多少篇文章包含单词 ii(至少出现一次计为包含),
  • yiy_i 表示单词 ii 在全部文章中出现的总次数。

样例输入

4 3
5 1 2 3 2 1
1 1
3 2 2 2
2 3 2

样例输出

2 3
3 6
2 2

说明

样例解释

以单词 22 为例:

  • 在文章 11 中出现 22 次;
  • 在文章 33 中出现 33 次;
  • 在文章 44 中出现 11 次;
  • 因此 x2=3,  y2=6x_2=3,\;y_2=6