北京市短租房源推荐
成员
- 徐一丹
- 刘嘉
- 刘玉洁
问题描述
1.问题背景分析
线上短租房市场发展势头迅猛, 共享经济为闲置的房屋资源提供了合理利用的途径, 避免了资金和空间的闲置浪费。当互联网的“订单经济”与旅游住宿相互交叉, 闲置房屋的短期出租交易作为共享经济在旅游届产生的新兴产业,由于其性价比高、租房周期随意、租房时间机动性强,正在逐渐代替传统酒店、旅馆住宿。当前,中国短租房交易较为活跃的地点主要集中在一线城市和东部城市,据统计,这些地区的房源供给和用户占比均在60%以上。可以预见,短租房未来市场潜力巨大,房源数、用户数、交易额等都将持续增加,而短租房交易的发展也将带动保洁、装修、维修、保险等相关行业的发展。同时,随着线上短租房交易平台巨头Airbnb的强势进驻,中国短租房交易市场迎来新一轮的机遇和挑战。促进共享经济中的短租房业务可持续发展需深入量化分析租房价格与数量的分布。
2.问题描述
2.1 数据准备
数据来自天池大数据竞赛,具体包括如下信息:
- 短租房源基础信息:房源、房东、位置、类型、价格、评论数量和可租时间等
- 短租房源时间表信息:房源、时间、是否可租、租金和可租天数等
- 短租房源的评论信息:房源id、评论日期、评论内容、作者信息等
- 北京的行政区域划分信息
2.2模型建立
采用数据挖掘课堂中学到的数据处理知识,对数据进行基本的探索性分析:分析房源类型分布、价格分布、位置分布等信息,并进行可视化
根据需求进行简单的房源推荐,在满足租房者价格、位置等基本需求后,对满足条件的房源信息进行评论挖掘,采用LSTM进行文本情感分析,推荐优质房源。
2.3预期的结果
展示挖掘到的探索性分析结果
在输入基本需求后,能获得符合要求的优质房源
项目分工
- 徐一丹:数据清洗可视化,模型实现,文档编写
- 刘嘉:探索性分析,模型集成与测试,文档编写
- 刘玉洁:LSTM文本情感分析,分析与预测结果,文档编写