2024数客杯竞赛 | 海鳗赛题
【赛题题目】游客行为特征分析与应用
【赛题业务场景】
了解游客行为特征对旅游目的地至关重要。通过深入分析游客的行为特征,可以帮助旅游目的地在旅游投资、旅游规划、旅游营销、旅游产品设计、旅游服务等方面提升决策水平,从而提升目的地的知名度和竞争力,吸引更多游客,促进当地旅游业的发展。
【赛题内容】
基于企业提供的数据集(请前往https://www.haimanyun.com/shukebei下载),辅以自行获得的数据做补充,充分挖掘数据集价值(如:探索游客的活动轨迹、停留时长,到访偏好等),尽可能构建全面而深入的游客行为特征分析体系,并提出针对该景区在旅游投资、旅游规划、旅游营销、旅游产品设计、旅游服务等任一方面中的优化改进建议。(说明:因旅游应用场景的专业性,鼓励跨专业组队。)
【赛题辅导及培训计划】
为参赛团队提供两次线上培训辅导:1)启航智慧旅游:大数据在旅游产业的应用与实践;2)揭秘挑战:赛题解析与数据深入探索。详见“竞赛工作坊|海鳗赛题辅导培训”。
培训&答疑联系方式
1.海鳗数据官网:https://www.haimanyun.com/shukebei
2.扫描企业客服微信二维码,添加联系咨询。添加时,请备注“2024数客杯”
【出题企业介绍及网址】
海鳗(北京)数据技术有限公司,是专注于文旅大数据平台型整合及深度价值挖掘的高科技公司,是国家级高新技术企业。海鳗云基于全量外部数据(互联网内容数据、手机GPS位置数据、银联清算数据、搜索数据等)对旅游目的地运营的各类场景提供大数据解决方案,为政府监督部门、景区等涉旅企业、旅游院校等提供数据驱动的新旅游生态下的行业监管、投资咨询、产品规划、管理提升、服务优化、智能营销等新能力。海鳗云客户已覆盖宁夏文旅厅、青海文旅厅、甘肃文旅厅、文山文旅局等省市级监管机构和泰山、崂山、黄山、青都等著名景区。
海鳗云重视产教融合,与国内知名旅游院校合作,推动旅游大数据教学和实践,与北京第二外国语学院、北京联合大学、北京工商大学、长春大学旅游学院等保持良好的合作关系。
公司网址:www.haimanyun.com
附:
海鳗赛题数据集说明:包含5月1日到5月15日期间到访过天津古文化街的游客相关位置信息,及他们涉及到的POI相关信息。
1.数据信息
数据名称 |
数据说明 |
稳定点位 |
在10分钟内扫描到的wifiap,稳定状态点位过滤信号强度小于-77dBm的数据 |
连接点位 |
连接ap时长超过1分钟所获得的位置数据 |
场景识别 |
SDK满足识别逻辑请求服务端获得的位置数据,请求数据包括wifi,cell,location等 |
定时点位 |
每半个小时获取一次位置 |
POI信息 |
点位数据中涉及到的POI信息,包括POI名称,分类,经纬度等 |
2.POI信息
字段名称 |
数据样例 |
数据含义 |
数据类型 |
id |
2499232 |
POI的唯一ID |
数值型 |
名称 |
天津古文化街 |
POI的名称 |
文本型 |
一级分类 |
旅游景点 |
POI的一级分类 |
文本型 |
二级分类 |
自然景观 |
POI的二级分类 |
文本型 |
三级分类 |
其他自然景观 |
POI的三级分类 |
文本型 |
品牌ID |
0 |
品牌的唯一ID,为0时代表未记录该品牌 |
数值型 |
品牌名称 |
品牌名称,为空时代表未记录该品牌 |
文本型 |
|
所在省份 |
天津市 |
POI所在省份 |
文本型 |
所在城市 |
天津市 |
POI所在城市 |
文本型 |
所在区县 |
南开区 |
POI所在区县 |
文本型 |
详细地址 |
通北路 |
POI详细地址 |
文本型 |
经度 |
117.198799 |
POI经度 |
数值型 |
纬度 |
39.149612 |
POI纬度 |
数值型 |
人均价格 |
在POI消费的人均价格,为空时代表未记录 |
数值型 |
3.WIFI连接
字段名称 |
数据样例 |
数据含义 |
数据类型 |
脱敏ID |
8605a59f-bd5d-4123-895b-b8b492110311 |
用户脱敏后的唯一ID |
文本型 |
经度 |
118.75529 |
WIFI的经度 |
数值型 |
纬度 |
32.05093 |
WIFI的纬度 |
数值型 |
p_id |
24588358 |
WIFI所属的POIid |
数值型 |
开始时间 |
2023/10/1 16:55 |
用户停留的开始时间 |
时间型 |
结束时间 |
2023/10/1 16:59 |
用户停留的结束时间 |
时间型 |
4.稳定点位
字段名称 |
数据样例 |
数据含义 |
数据类型 |
脱敏ID |
8605a59f-bd5d-4123-895b-b8b492110311 |
用户脱敏后的唯一ID |
文本型 |
经度 |
118.75529 |
WIFI的经度 |
数值型 |
纬度 |
32.05093 |
WIFI的纬度 |
数值型 |
p_id |
24588358 |
WIFI所属的POIid |
数值型 |
开始时间 |
2023/10/1 16:55 |
用户停留的开始时间 |
时间型 |
结束时间 |
2023/10/1 16:59 |
用户停留的结束时间 |
时间型 |
5.场景识别
字段名称 |
数据样例 |
数据含义 |
数据类型 |
脱敏ID |
8605a59f-bd5d-4123-895b-b8b492110311 |
用户脱敏后的唯一ID |
文本型 |
经度 |
118.75529 |
WIFI的经度 |
数值型 |
纬度 |
32.05093 |
WIFI的纬度 |
数值型 |
p_id |
24588358 |
WIFI所属的POIid |
数值型 |
开始时间 |
2023/10/1 16:55 |
用户停留的开始时间 |
时间型 |
结束时间 |
2023/10/1 16:59 |
用户停留的结束时间 |
时间型 |
6.定时点位
字段名称 |
数据样例 |
数据含义 |
数据类型 |
脱敏ID |
8605a59f-bd5d-4123-895b-b8b492110311 |
用户脱敏后的唯一ID |
文本型 |
经度 |
118.75529 |
用户的经度 |
数值型 |
纬度 |
32.05093 |
用户的纬度 |
数值型 |
时间 |
2023/10/1 16:55 |
用户定时点位上报时间 |
时间型 |