27 lines
692 B
Python
27 lines
692 B
Python
# 导入处理器
|
|
from movielens_processor import MovieLensProcessor
|
|
|
|
# 初始化处理器并指定数据路径
|
|
processor = MovieLensProcessor(data_path='./dataset')
|
|
|
|
# 1. 加载数据
|
|
processor.load_data(verbose=True)
|
|
|
|
# 2. 清洗数据
|
|
processor.clean_data(verbose=True)
|
|
|
|
# 3. 分析数据质量
|
|
quality_metrics = processor.analyze_data_quality(plot=True)
|
|
|
|
# 4. 创建评分矩阵 (稀疏表示)
|
|
rating_sparse = processor.create_rating_matrix(sparse=True)
|
|
|
|
# 5. 划分训练测试集 (基于时间)
|
|
train_ratings, test_ratings = processor.split_train_test(
|
|
test_ratio=0.2,
|
|
method='time'
|
|
)
|
|
|
|
# 6. 保存处理后的数据
|
|
processor.save_processed_data(output_dir='./processed_data')
|