评分方法
Japan Dining Index 综合多个公开来源进行独立评估。
六大评分维度
店铺已确立的格调,参照公开版米其林指南。
基于公开点评数据聚合的食客综合评分。
餐厅当前所获得的注意力。
相对于价位带的物有所值程度。
对不会日语的访客的可达性——语言、菜单、支付、预订入口。
基础信号之间的一致程度——决定你应在多大程度上信任那个总分。
分数区间
原则
- 多源参照——任何单一平台都不主导评分。
- 以信号为本——不复制点评文本或图片。
- 独立运营——排名不可购买。
- 保守取分——只在证据具体时给高分。
我们不做什么
- 我们不复制米其林指南的评级结论或编辑文本。
- 我们不抓取米其林指南的付费墙内容。
- 评分基于公开信息聚合与本站独立权重——不会照搬 Tabelog、一休等点评原文。
- 我们不抓取需要登录的内容或实时空位信息。
我们公开什么,不公开什么
每家餐厅页面上,我们展示一个总分(0–100,分 S/A/B/C/D 段),六个维度的分项,以及结构化的决策信息(价位带、预订难度、英文程度)。六个维度在页面上单独陈列,便于读者读"评分的形状",而不只是看那个总分。
权重按季度对一组业界共识明确的餐厅构成的保留校准集进行校准。当前权重区间(随分数段浮动):
- 格调 20–30%
- 评分 15–25%
- 性价比 15–20%
- 外国人友好 10–15%
- 关注度 10–15%
- 稳定性 5–10%(作为置信度乘数,不参与加权累加)
我们不公开每月的精确权重,原因有二:(a) 它们随校准动态调整;(b) 输入信号本身也随时间变化,发布某一时刻的快照只会误导读者。上面这套打分维度、维度定义、分数段、以及下文的信号来源清单,才是我们公开承诺会保持稳定的部分。
分数分布
本指数收录的 1009 家米其林相关餐厅,分布如下:
- S(80–100) 23 家 (2.3%)
- A(72–79) 80 家 (7.9%)
- B(60–71) 231 家 (22.9%)
- C(50–59) 377 家 (37.4%)
- D(<50) 298 家 (29.5%)
跻身 S 或 A 段的 103 家中,103 家(100.0%)同时在最近一版米其林指南中保有一颗及以上星。六维评分与米其林的判定在指数顶端高度一致,到长尾段分歧加大——这里的评分会把星制度不直接计入的性价比、外国人友好、稳定性纳入考量,常把必比登或入选店推到同价位下星数更少的对手之上。
为什么是 6 个维度
我们在保留校准集上分别测试过 3 维、6 维、8 维和 10 维的评分体系。3 维与米其林星数过度相关,相当于把指南已经发布的信息原样重述。10 维则出现冗余——"酒单深度"、"鸡尾酒项目"、"佐酒搭配"加载在同一个潜在因子上,徒增噪声。6 维是各维度都能为读者关心的结果(预订决策、回访意愿、推荐意愿)贡献独立方差、且每个维度都至少有一个公开可观测信号支撑的最小集合。
信号来源
每个分数都建立在以下来源的公开可观测信号之上(按字母顺序,非穷举):
- Google 地图 / Apple 地图——位置、营业时间、照片是否存在、公开点评数。
- 米其林指南——仅采用公开版本(星级、必比登、入选)。我们不抓取付费墙内容。
- 食べログ(Tabelog)——公开的数字评分与点评数。不复制点评原文或图片。
- 一休 / OMAKASE / TableCheck / Pocket Concierge——预订平台是否覆盖、申报价位带、语言支持、押金与取消政策的披露程度。
- 餐厅自有官网——菜单结构、预订路径、英文页面有无。
我们仅使用结构化信号——数字评分、计数、申报价位带、预订平台覆盖。不复制任何第三方的点评原文、图片或编辑内容。
数据取向
所有输入都来自公开可访问的资料——餐厅自有页面、公开版米其林指南、公开评分平台、搜索与地图平台、预订平台。我们不抓取付费墙背后、需登录的页面,或米其林对外销售访问权的内容。
我们仅使用这些来源公开发布的结构化信号(评分、件数、分类、申报价位带)。我们不复制任何第三方的编辑文本、点评原文或图片。
地址翻译、地区名归一化、标签合成等内部加工由本站流水线生成并明确标注为本站产出,绝不冒充第三方来源。
更新节奏
整个流水线按月重跑,并在观察到任何重大变化时立即重跑。重大变化包括:闭店或迁址、星级变动、价格大幅调整、新预订平台的出现,以及对所覆盖城市内此前漏收店铺的发现。Sitemap 中每家餐厅的 lastmod 反映的是真实数据更新,而不是构建时间戳,便于搜索引擎只重新爬取真正变化的页面。
已知局限
本站坦诚陈述以下几项局限:
- 无访谈。我们不与主厨、店主或经理直接交谈。本站页面不含需要"渠道"才能拿到的内幕信息。
- 无独家摄影。本站所示餐厅图片来自公开来源,使用其原始公开许可与分辨率。我们不委托新拍摄。
- 无实时空位信息。即使本站标为"易订",今晚也可能已满。实时状态请到预订平台查看。
- 覆盖空白。某家餐厅未出现在本指数中,可能仅仅是因为还未导入,不一定是评估后被排除。请通过 [email protected] 反馈漏录。
- 薄数据下评分波动。新开业、公开评论史薄弱的店,得分将带有较大不确定性。这种情况下应主要看稳定性维度。
开放数据
本指数当前收录的 1009 家餐厅快照——slug、英文名、城市、菜系、米其林状态、总分、六个维度、申报价位带——以扁平 CSV 形式公开:restaurants.csv(字段说明、许可与 pandas 示例见 数据落地页)。每次构建会重新生成。
数据集采用 CC BY-NC 4.0 许可——非商业用途下,注明来源 Japan Fine Dining Index 即可自由使用、共享、改编。如需商业使用、批量或程序化访问,请来信 [email protected]。