2
0

generate-area-sql.mjs 5.9 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206
  1. #!/usr/bin/env node
  2. /**
  3. * 区域数据CSV转SQL导入脚本
  4. * 将 docs/省市区.csv 转换为 area_data 表的 INSERT 语句
  5. * 使用方法: node docs/generate-area-sql.mjs
  6. */
  7. import fs from 'fs';
  8. import path from 'path';
  9. import { fileURLToPath } from 'url';
  10. // 获取当前目录
  11. const __filename = fileURLToPath(import.meta.url);
  12. const __dirname = path.dirname(__filename);
  13. // 文件路径
  14. const csvFilePath = path.join(__dirname, '省市区.csv');
  15. const outputSqlPath = path.join(__dirname, 'area_data_init.sql');
  16. // 读取CSV文件
  17. function readCSV(filePath) {
  18. try {
  19. const content = fs.readFileSync(filePath, 'utf-8');
  20. return content.trim().split('\n');
  21. } catch (error) {
  22. console.error('读取CSV文件失败:', error.message);
  23. process.exit(1);
  24. }
  25. }
  26. // 解析CSV行
  27. function parseCSVLine(line) {
  28. // 处理包含逗号的字段
  29. const parts = line.split(',');
  30. if (parts.length !== 3) {
  31. console.warn('跳过格式不正确的行:', line);
  32. return null;
  33. }
  34. const [id, parentId, name] = parts;
  35. const parsedId = parseInt(id.trim());
  36. const parsedParentId = parseInt(parentId.trim()) || null;
  37. const parsedName = name.trim();
  38. // 推断层级和行政区划代码
  39. let level, code;
  40. if (parsedParentId === 0 || parsedParentId === null) {
  41. level = 1; // 省/直辖市
  42. code = parsedId.toString().padStart(6, '0'); // 省级代码
  43. } else {
  44. // 根据parentId推断层级
  45. // 如果parentId是省级(1-33),则当前是市级
  46. // 如果parentId是市级(34-...),则当前是区县级
  47. if (parsedParentId >= 1 && parsedParentId <= 33) {
  48. level = 2; // 市
  49. } else {
  50. level = 3; // 区/县
  51. }
  52. code = parsedId.toString().padStart(6, '0');
  53. }
  54. return {
  55. id: parsedId,
  56. parentId: parsedParentId,
  57. name: parsedName,
  58. level,
  59. code
  60. };
  61. }
  62. // 生成SQL语句
  63. function generateSQLStatements(data) {
  64. const statements = [
  65. '-- 区域数据初始化脚本',
  66. '-- 来源: scripts/省市区.csv',
  67. '-- 生成时间: ' + new Date().toISOString(),
  68. '-- 数据库: PostgreSQL',
  69. '',
  70. '-- 清空现有数据(可选)',
  71. '-- TRUNCATE TABLE areas;',
  72. '',
  73. '-- 插入区域数据',
  74. 'INSERT INTO areas (id, parent_id, name, level, code, is_disabled, is_deleted, created_at, updated_at) VALUES'
  75. ];
  76. const values = data.map(item =>
  77. ` (${item.id}, ${item.parentId === null ? 'NULL' : item.parentId}, '${escapeString(item.name)}', '${item.level}', '${item.code}', 0, 0, NOW(), NOW())`
  78. );
  79. statements.push(values.join(',\n'));
  80. statements.push('ON CONFLICT (id) DO UPDATE SET');
  81. statements.push(' parent_id = EXCLUDED.parent_id,');
  82. statements.push(' name = EXCLUDED.name,');
  83. statements.push(' level = EXCLUDED.level,');
  84. statements.push(' code = EXCLUDED.code,');
  85. statements.push(' updated_at = NOW();');
  86. return statements.join('\n');
  87. }
  88. // 转义SQL字符串
  89. function escapeString(str) {
  90. return str.replace(/'/g, "''");
  91. }
  92. // 验证数据完整性
  93. function validateData(data) {
  94. const ids = new Set();
  95. const parentIds = new Set();
  96. const levels = { 1: 0, 2: 0, 3: 0 };
  97. for (const item of data) {
  98. if (ids.has(item.id)) {
  99. console.warn(`重复的ID: ${item.id}`);
  100. }
  101. ids.add(item.id);
  102. if (item.parentId !== null && item.parentId !== 0) {
  103. parentIds.add(item.parentId);
  104. }
  105. // 统计各层级数量
  106. if (item.level >= 1 && item.level <= 3) {
  107. levels[item.level]++;
  108. }
  109. }
  110. // 检查所有parentId是否都存在对应的记录
  111. for (const parentId of parentIds) {
  112. if (!ids.has(parentId)) {
  113. console.warn(`父ID不存在: ${parentId}`);
  114. }
  115. }
  116. console.log(`总计 ${data.length} 条区域数据`);
  117. console.log(`顶级区域数量: ${data.filter(item => item.parentId === 0 || item.parentId === null).length}`);
  118. console.log(`省级区域数量: ${levels[1]}`);
  119. console.log(`市级区域数量: ${levels[2]}`);
  120. console.log(`区县级区域数量: ${levels[3]}`);
  121. }
  122. // 主函数
  123. function main() {
  124. console.log('开始生成区域数据SQL文件...');
  125. // 检查CSV文件是否存在
  126. if (!fs.existsSync(csvFilePath)) {
  127. console.error('CSV文件不存在:', csvFilePath);
  128. process.exit(1);
  129. }
  130. // 读取并解析CSV
  131. const lines = readCSV(csvFilePath);
  132. // 跳过表头
  133. const header = lines[0];
  134. if (header !== 'aId,aFId,aName') {
  135. console.warn('CSV文件格式可能不正确,表头不匹配');
  136. }
  137. const data = [];
  138. for (let i = 1; i < lines.length; i++) {
  139. const line = lines[i].trim();
  140. if (line) {
  141. const item = parseCSVLine(line);
  142. if (item) {
  143. data.push(item);
  144. }
  145. }
  146. }
  147. // 验证数据
  148. validateData(data);
  149. // 生成SQL
  150. const sql = generateSQLStatements(data);
  151. // 写入SQL文件
  152. try {
  153. fs.writeFileSync(outputSqlPath, sql, 'utf-8');
  154. console.log('SQL文件已生成:', outputSqlPath);
  155. console.log('文件大小:', (fs.statSync(outputSqlPath).size / 1024).toFixed(2), 'KB');
  156. } catch (error) {
  157. console.error('写入SQL文件失败:', error.message);
  158. process.exit(1);
  159. }
  160. // 生成使用说明
  161. console.log('\n使用说明:');
  162. console.log('1. 运行: node scripts/generate-area-sql.mjs');
  163. console.log('2. 执行生成的SQL文件: psql -h 127.0.0.1 -U postgres -d postgres -f scripts/area_data_init.sql');
  164. console.log('3. 或者直接在数据库管理工具中执行SQL内容');
  165. }
  166. // 执行主函数
  167. if (import.meta.url === `file://${process.argv[1]}`) {
  168. main();
  169. }
  170. export {
  171. readCSV,
  172. parseCSVLine,
  173. generateSQLStatements,
  174. validateData
  175. };