New upstream version 1.16.0.upstream/1.16.0

author: Unit 193 <unit193@unit193.net> 2020-12-13 23:07:42 -0500
committer: Unit 193 <unit193@unit193.net> 2020-12-13 23:07:42 -0500
commit: 8f7c87a2697113134c311aaeafd9c919555a2741 (patch)
tree: 4ff7316ac1570683b3c968fd30d044925e47a2a5 /gallery_dl/extractor/twitter.py
parent: 143723944033d7a6593d57bd1cf6ae97713b6ce7 (diff)
1 files changed, 41 insertions, 18 deletions
diff --git a/gallery_dl/extractor/twitter.py b/gallery_dl/extractor/twitter.py
index fe0b3c5..a77ea06 100644
--- a/gallery_dl/extractor/twitter.py
+++ b/gallery_dl/extractor/twitter.py
@@ -106,15 +106,26 @@ class TwitterExtractor(Extractor):
                     })
             elif "media_url_https" in media:
                 url = media["media_url_https"]
+                base, _, fmt = url.rpartition(".")
+                base += "?format=" + fmt + "&name="
                 files.append(text.nameext_from_url(url, {
-                    "url"      : url + ":orig",
-                    "_fallback": [url+":large", url+":medium", url+":small"],
+                    "url"      : base + "orig",
                     "width"    : width,
                     "height"   : height,
+                    "_fallback": self._image_fallback(base, url),
                 }))
             else:
                 files.append({"url": media["media_url"]})
 
+    @staticmethod
+    def _image_fallback(base, url):
+        url += ":"
+        yield url + "orig"
+
+        for size in ("large", "medium", "small"):
+            yield base + size
+            yield url + size
+
     def _extract_card(self, tweet, files):
         card = tweet["card"]
         if card["name"] in ("summary", "summary_large_image"):
@@ -267,7 +278,7 @@ class TwitterTimelineExtractor(TwitterExtractor):
     test = (
         ("https://twitter.com/supernaturepics", {
             "range": "1-40",
-            "url": "0106229d408f4111d9a52c8fd2ad687f64842aa4",
+            "url": "c570ac1aae38ed1463be726cc46f31cac3d82a40",
         }),
         ("https://mobile.twitter.com/supernaturepics?p=i"),
         ("https://www.twitter.com/id:2976459548"),
@@ -291,7 +302,7 @@ class TwitterMediaExtractor(TwitterExtractor):
     test = (
         ("https://twitter.com/supernaturepics/media", {
             "range": "1-40",
-            "url": "0106229d408f4111d9a52c8fd2ad687f64842aa4",
+            "url": "c570ac1aae38ed1463be726cc46f31cac3d82a40",
         }),
         ("https://mobile.twitter.com/supernaturepics/media#t"),
         ("https://www.twitter.com/id:2976459548/media"),
@@ -374,12 +385,12 @@ class TwitterTweetExtractor(TwitterExtractor):
     pattern = BASE_PATTERN + r"/([^/?#]+|i/web)/status/(\d+)"
     test = (
         ("https://twitter.com/supernaturepics/status/604341487988576256", {
-            "url": "0e801d2f98142dd87c3630ded9e4be4a4d63b580",
+            "url": "88a40f7d25529c2501c46f2218f9e0de9aa634b4",
             "content": "ab05e1d8d21f8d43496df284d31e8b362cd3bcab",
         }),
         # 4 images
         ("https://twitter.com/perrypumas/status/894001459754180609", {
-            "url": "c8a262a9698cb733fb27870f5a8f75faf77d79f6",
+            "url": "3a2a43dc5fb79dd5432c701d8e55e87c4e551f47",
         }),
         # video
         ("https://twitter.com/perrypumas/status/1065692031626829824", {
@@ -396,7 +407,7 @@ class TwitterTweetExtractor(TwitterExtractor):
         }),
         # Reply to deleted tweet (#403, #838)
         ("https://twitter.com/i/web/status/1170041925560258560", {
-            "pattern": r"https://pbs.twimg.com/media/EDzS7VrU0AAFL4_.jpg:orig",
+            "pattern": r"https://pbs.twimg.com/media/EDzS7VrU0AAFL4_",
         }),
         # 'replies' option (#705)
         ("https://twitter.com/i/web/status/1170041925560258560", {
@@ -405,13 +416,13 @@ class TwitterTweetExtractor(TwitterExtractor):
         }),
         # quoted tweet (#526, #854)
         ("https://twitter.com/StobiesGalaxy/status/1270755918330896395", {
-            "pattern": r"https://pbs\.twimg\.com/media/Ea[KG].+\.jpg",
+            "pattern": r"https://pbs\.twimg\.com/media/Ea[KG].+=jpg",
             "count": 8,
         }),
         # "quoted" option (#854)
         ("https://twitter.com/StobiesGalaxy/status/1270755918330896395", {
             "options": (("quoted", False),),
-            "pattern": r"https://pbs\.twimg\.com/media/EaK.+\.jpg",
+            "pattern": r"https://pbs\.twimg\.com/media/EaK.+=jpg",
             "count": 4,
         }),
         # TwitPic embeds (#579)
@@ -422,7 +433,7 @@ class TwitterTweetExtractor(TwitterExtractor):
         }),
         # Nitter tweet (#890)
         ("https://nitter.net/ed1conf/status/1163841619336007680", {
-            "url": "0f6a841e23948e4320af7ae41125e0c5b3cadc98",
+            "url": "4a9ea898b14d3c112f98562d0df75c9785e239d9",
             "content": "f29501e44d88437fe460f5c927b7543fda0f6e34",
         }),
         # Twitter card (#1005)
@@ -494,19 +505,25 @@ class TwitterAPI():
         }
 
         cookies = self.extractor.session.cookies
+        cookiedomain = ".twitter.com"
 
         # CSRF
-        csrf = util.generate_csrf_token()
-        self.headers["x-csrf-token"] = csrf
-        cookies.set("ct0", csrf, domain=".twitter.com")
-
-        if cookies.get("auth_token", domain=".twitter.com"):
+        csrf_token = cookies.get("ct0", domain=cookiedomain)
+        if not csrf_token:
+            csrf_token = util.generate_csrf_token()
+            cookies.set("ct0", csrf_token, domain=cookiedomain)
+        self.headers["x-csrf-token"] = csrf_token
+
+        if cookies.get("auth_token", domain=cookiedomain):
+            # logged in
+            self.root = "https://twitter.com/i/api/"
             self.headers["x-twitter-auth-type"] = "OAuth2Session"
         else:
-            # guest token
+            # guest
+            self.root = "https://api.twitter.com/"
             guest_token = self._guest_token()
+            cookies.set("gt", guest_token, domain=cookiedomain)
             self.headers["x-guest-token"] = guest_token
-            cookies.set("gt", guest_token, domain=".twitter.com")
 
     def tweet(self, tweet_id):
         endpoint = "2/timeline/conversation/{}.json".format(tweet_id)
@@ -597,10 +614,16 @@ class TwitterAPI():
         return self._call(endpoint, None, "POST")["guest_token"]
 
     def _call(self, endpoint, params, method="GET"):
-        url = "https://api.twitter.com/" + endpoint
+        url = self.root + endpoint
         response = self.extractor.request(
             url, method=method, params=params, headers=self.headers,
             fatal=None)
+
+        # update 'x-csrf-token' header (#1170)
+        csrf_token = response.cookies.get("ct0")
+        if csrf_token:
+            self.headers["x-csrf-token"] = csrf_token
+
         if response.status_code < 400:
             return response.json()
         if response.status_code == 429:
author	Unit 193 <unit193@unit193.net>	2020-12-13 23:07:42 -0500
committer	Unit 193 <unit193@unit193.net>	2020-12-13 23:07:42 -0500
commit	8f7c87a2697113134c311aaeafd9c919555a2741 (patch)
tree	4ff7316ac1570683b3c968fd30d044925e47a2a5 /gallery_dl/extractor/twitter.py
parent	143723944033d7a6593d57bd1cf6ae97713b6ce7 (diff)