01 某音短视频
SQL156 各个视频的平均完播率
【描述】用户-视频互动表tb_user_video_log。(uid-用户ID, video_id-视频ID, start_time-开始观看时间, end_time-结束观看时间, if_follow-是否关注, if_like-是否点赞, if_retweet-是否转发, comment_id-评论ID)
短视频信息表tb_video_info。(video_id-视频ID, author-创作者ID, tag-类别标签, duration-视频时长(秒), release_time-发布时间)
【问题】计算2021年里有播放记录的每个视频的完播率(结果保留三位小数),并按完播率降序排序
select t.video_id, ROUND(sum(if((t.end_time-t.start_time)>=t1.duration,1,0))/count(start_time),3) as avg_comp_play_rate from tb_user_video_log t left join tb_video_info t1 on t.video_id=t1.video_id where year(t.start_time)='2021' group by t.video_id order by avg_comp_play_rate desc;
解题思路:①、考察多表结合。
②、视频完播率的计算方法。
第1步:先计算完成播放次数。sum(if((t.end_time-t.start_time)>=t1.duration,1,0
第2步:计算总播放次数。count(start_time)
第3步:保存三位小数。使用ROUND(xx,3)
③、where子条件,筛选2021年,使用year函数
④、order by排序,按照完播率降序,使用desc。
SQL157 平均播放进度大于60%的视频类别
【描述】同上题
问题:计算各类视频的平均播放进度,将进度大于60%的类别输出。
结果保留两位小数,并按播放进度倒序排序。
select t1.tag, concat(ROUND(avg(if(timestampdiff(second,t.start_time,t.end_time)>=t1.duration,1, timestampdiff(second,t.start_time,t.end_time)/t1.duration))*100,2),'%') as avg_play_progress from tb_video_info t1 join tb_user_video_log t on t1.video_id=t.video_id group by t1.tag having avg_play_progress>60 order by avg_play_progress desc;
解题思路:
1、播放进度结算
①、时间差函数,timestampdiff(unit,char(begin-end))
②、判断,if或者用case when
③、结果保留两位小数,使用round(xx,2)
④、使用concat拼接数值和“%”
2、多表的内连接。
3、进度大于60%的类别输出,因为这个数值是聚合函数,需要使用having函数
4、并按播放进度倒序排序。使用order by desc
SQL158 每类视频近一个月的转发量/率
【描述】用户-视频互动表tb_user_video_log。(uid-用户ID, video_id-视频ID, start_time-开始观看时间, end_time-结束观看时间, if_follow-是否关注, if_like-是否点赞, if_retweet-是否转发, comment_id-评论ID)
短视频信息表tb_video_info。(video_id-视频ID, author-创作者ID, tag-类别标签, duration-视频时长, release_time-发布时间)
select t1.tag, sum(t.if_retweet) as retweet_cut,-- 转发量 round(sum(t.if_retweet)/count(t.video_id),3) as retweet_rate from tb_video_info t1 left join tb_user_video_log t on t.video_id=t1.video_id where date(start_time)>(select date_sub(MAX(start_time),interval 30 day) from tb_user_video_log) group by t1.tag order by retweet_rate desc;
解题思路:
转发量:sum(if_reweet)
转发率:转发量/播放量。也就是sum(if_reweet)/count(video_id)。结果保留3位小数,就是用ROUND(转发率,3)即可
最近30天:
写法①、date_sub函数(时间向前推移函数)
(select date_sub(MAX(start_time),interval 30 day) from tb_user_video_log ------这一步的意思是以最新的播放日期为准,向前推移30天。
写法②、timestampdiff函数(时间差函数)
timestampdiff(date,t.start_time,(select max(t.start_time) from tb_user_video_log)<30
文章评论