标签:google-cloud-dataflow
-
Apache Beam with Python:如何在会话窗口中计算最小值并将其应用于所有相关的PCollections - python
我正在使用Apache Beam的Python SDK来处理字典,这些字典代表着流分析命中率。由于会话窗口的缘故,命中次数得以汇总。我的DataFlow真正要做的就是应用这些会话窗口,并将会话ID分配给所有相关的匹配。 作为会话ID,我已经确定我将使用首次匹配的时间戳(结合每个用户的Cookie ID)。这是我的管道: msgs = p | 'Re […]