# 导入处理器 from movielens_processor import MovieLensProcessor # 初始化处理器并指定数据路径 processor = MovieLensProcessor(data_path='./dataset') # 1. 加载数据 processor.load_data(verbose=True) # 2. 清洗数据 processor.clean_data(verbose=True) # 3. 分析数据质量 quality_metrics = processor.analyze_data_quality(plot=True) # 4. 创建评分矩阵 (稀疏表示) rating_sparse = processor.create_rating_matrix(sparse=True) # 5. 划分训练测试集 (基于时间) train_ratings, test_ratings = processor.split_train_test( test_ratio=0.2, method='time' ) # 6. 保存处理后的数据 processor.save_processed_data(output_dir='./processed_data')