MovieLens/data_weaving_preparation.py
2025-05-05 02:29:05 +08:00

27 lines
692 B
Python

# 导入处理器
from movielens_processor import MovieLensProcessor
# 初始化处理器并指定数据路径
processor = MovieLensProcessor(data_path='./dataset')
# 1. 加载数据
processor.load_data(verbose=True)
# 2. 清洗数据
processor.clean_data(verbose=True)
# 3. 分析数据质量
quality_metrics = processor.analyze_data_quality(plot=True)
# 4. 创建评分矩阵 (稀疏表示)
rating_sparse = processor.create_rating_matrix(sparse=True)
# 5. 划分训练测试集 (基于时间)
train_ratings, test_ratings = processor.split_train_test(
test_ratio=0.2,
method='time'
)
# 6. 保存处理后的数据
processor.save_processed_data(output_dir='./processed_data')