https://www.orefolder.net/2023/08/x-t-co/
> X(旧Twitter)で使われている短縮リンクt.coにおいて、古いものが機能しなくなっています。ユーザーが元々書いたURLは消えたまま、リンクの付かないt.coのURLが表示されるだけになっています。
えええ……。
確かに自分の #twilog で調べたら、2011年あたりのリンクがたどれなくなっている。時期によって挙動が違うようなので、あとで調査するつもり。
ちなみに #Notestock ではt.coのURLは元のURLに変換されており、t.coを経由せずにリンク先に行けるようになっているようである。おささん偉い。
t.coのリンクの調査の続き。
自分のアーカイブが取得できたので調査してみた。前回(2023/04/06)に取得したものよりtweets.jsのサイズが91KB小さくなっており、悪い予感がする。jqやdiffなどをごにょごにょした結果分かったことは以下の通り。
- 上記のBやCの期間(2011/06/10から2014/11/11まで)について、アーカイブからも外部URL情報が消失している。つまり、今からアーカイブを取得しても、2014年11月上旬あたりまでの外部URLは取り戻せない。
- なぜか2017/05/18の1ツイートについても、散発的にURLが消えていた。よって、新しめのツイートについても安心はできない。
@another twilogのログのダウンロードで取得できるCSVデータには、元URLが記載されていました。今日(2023-08-15)にダウンロードしたデータでも大丈夫でした。
ツイートを取得した時点で短縮URLを展開して保存してるのかな?
@alisato いえ、twilogのCSVではなく、Twitterから取得するアーカイブの話です。(参照: https://help.twitter.com/ja/managing-your-account/how-to-download-your-twitter-archive )
@another あ、はい、Twitterから取得するアーカイブであることは認識してます。
twilogのCSVログには元URLが載っているので、併用すれば元URLを知ることはできるかなと。
アーカイブがダメだと知って絶望しちゃう人もいると思うので。
@alisato Twilogについては、「ツイートを取得した時点で短縮URLを展開して保存してる」のだと僕も思います。
一応補足。自分が2023/04/06に取得したアーカイブと2023/08/14に取得したそれとの比較結果です。