与数据仓库合作近一年,爱恨情仇不必说,本文仅复盘整理所学所得,希望我与读者能从中得到收获与启发。

埋点
先谈谈埋点吧——用户行为分析的数据来源(通俗些就是格式化,以表格形式展示的目标日志数据)。
战士上战场,莫得子弹 就是一个死——分析者是战士,数据就是子弹,埋点就像制造子弹的机床。
就我所知,目前大部分企业获取用户行为大数据**的方式就是在各终端设置埋点。目前使用的是全埋点的策略——也就是终端框架内,所有可交互的元素在触发时都会被采集。
(好像5W一下子都有了)
How
采集元素目前主要分为四大类:页面采集(Page)[弹窗的弹出也可以归类为页面元素上报]、按钮采集(Button)、输入框采集(Input)、列表曝光采集(Expose)。
所有希望数据入库的事业部,必须严格按照上报入库流程与格式,传入数据,并给出相应注释。
这是目前整个大数据侧埋点入库的基本框架,他对所有事业部都一视同仁,保证了行为数据入库的规则性(觉得此处用“规范”,力度欠缺)。
规则性这个定义,在我的职业(还有学习,生活)生涯中真的很重要,很重要,很重要。特别是对数仓这样一个承载各方海量数据,且经常出现跨系统关联的载体来说,严格遵循入库规则是重中之重,否则就是一场灾难。
好了,再细说一下埋点采集与数据上报:
闽ICP备13000641号-4