Update copyright
[friendica.git/.git] / src / Content / Text / Markdown.php
1 <?php
2 /**
3  * @copyright Copyright (C) 2010-2021, the Friendica project
4  *
5  * @license GNU AGPL version 3 or any later version
6  *
7  * This program is free software: you can redistribute it and/or modify
8  * it under the terms of the GNU Affero General Public License as
9  * published by the Free Software Foundation, either version 3 of the
10  * License, or (at your option) any later version.
11  *
12  * This program is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU Affero General Public License for more details.
16  *
17  * You should have received a copy of the GNU Affero General Public License
18  * along with this program.  If not, see <https://www.gnu.org/licenses/>.
19  *
20  */
21
22 namespace Friendica\Content\Text;
23
24 use Friendica\Core\System;
25 use Friendica\DI;
26 use Friendica\Model\Contact;
27
28 /**
29  * Friendica-specific usage of Markdown
30  */
31 class Markdown
32 {
33         /**
34          * Converts a Markdown string into HTML. The hardwrap parameter maximizes
35          * compatibility with Diaspora in spite of the Markdown standard.
36          *
37          * @param string $text
38          * @param bool   $hardwrap Enables line breaks on \n without two trailing spaces
39          * @param string $baseuri  Optional. Prepend anchor links with this URL
40          * @return string
41          */
42         public static function convert($text, $hardwrap = true, $baseuri = null) {
43                 $stamp1 = microtime(true);
44
45                 $MarkdownParser = new MarkdownParser();
46                 $MarkdownParser->code_class_prefix  = 'language-';
47                 $MarkdownParser->hard_wrap          = $hardwrap;
48                 $MarkdownParser->hashtag_protection = true;
49                 $MarkdownParser->url_filter_func    = function ($url) use ($baseuri) {
50                         if (!empty($baseuri) && strpos($url, '#') === 0) {
51                                 $url = ltrim($baseuri, '/') . $url;
52                         }
53                         return  $url;
54                 };
55
56                 $text = self::convertDiasporaMentionsToHtml($text);
57
58                 $html = $MarkdownParser->transform($text);
59
60                 DI::profiler()->saveTimestamp($stamp1, "parser");
61
62                 return $html;
63         }
64
65         /**
66          * Replace Diaspora-style mentions in a text since they trip the Markdown parser autolinker.
67          *
68          * @param string $text
69          * @return string
70          */
71         private static function convertDiasporaMentionsToHtml(string $text)
72         {
73                 return preg_replace_callback(
74                         '/([@!]){(?:([^}]+?); ?)?([^} ]+)}/',
75                         /*
76                          * Matching values for the callback
77                          * [1] = mention type (@ or !)
78                          * [2] = name (optional)
79                          * [3] = profile URL
80                          */
81                         function ($matches) {
82                                 if ($matches[3] == '') {
83                                         return '';
84                                 }
85
86                                 $data = Contact::getByURL($matches[3]);
87
88                                 if (empty($data)) {
89                                         return '';
90                                 }
91
92                                 $name = $matches[2];
93
94                                 if ($name == '') {
95                                         $name = $data['name'];
96                                 }
97
98                                 return $matches[1] . '<a href="' . $data['url'] . '">' . $name . '</a>';
99                         },
100                         $text
101                 );
102         }
103
104         /*
105          * we don't want to support a bbcode specific markdown interpreter
106          * and the markdown library we have is pretty good, but provides HTML output.
107          * So we'll use that to convert to HTML, then convert the HTML back to bbcode,
108          * and then clean up a few Diaspora specific constructs.
109          */
110         public static function toBBCode($s)
111         {
112                 // The parser cannot handle paragraphs correctly
113                 $s = str_replace(['</p>', '<p>', '<p dir="ltr">'], ['<br>', '<br>', '<br>'], $s);
114
115                 // Escaping hashtags that could be titles
116                 $s = preg_replace('/^\#([^\s\#])/im', '\#$1', $s);
117
118                 $s = self::convert($s);
119
120                 $s = HTML::toBBCode($s);
121
122                 // protect the recycle symbol from turning into a tag, but without unescaping angles and naked ampersands
123                 $s = str_replace('&#x2672;', html_entity_decode('&#x2672;', ENT_QUOTES, 'UTF-8'), $s);
124
125                 //$s = preg_replace("/([^\]\=]|^)(https?\:\/\/)(vimeo|youtu|www\.youtube|soundcloud)([a-zA-Z0-9\:\/\-\?\&\;\.\=\_\~\#\%\$\!\+\,]+)/ism", '$1[url=$2$3$4]$2$3$4[/url]',$s);
126                 $s = BBCode::pregReplaceInTag('/\[url\=?(.*?)\]https?:\/\/www.youtube.com\/watch\?v\=(.*?)\[\/url\]/ism', '[youtube]$2[/youtube]', 'url', $s);
127                 $s = BBCode::pregReplaceInTag('/\[url\=https?:\/\/www.youtube.com\/watch\?v\=(.*?)\].*?\[\/url\]/ism'   , '[youtube]$1[/youtube]', 'url', $s);
128                 $s = BBCode::pregReplaceInTag('/\[url\=?(.*?)\]https?:\/\/vimeo.com\/([0-9]+)(.*?)\[\/url\]/ism'        , '[vimeo]$2[/vimeo]'    , 'url', $s);
129                 $s = BBCode::pregReplaceInTag('/\[url\=https?:\/\/vimeo.com\/([0-9]+)\](.*?)\[\/url\]/ism'              , '[vimeo]$1[/vimeo]'    , 'url', $s);
130
131                 // remove duplicate adjacent code tags
132                 $s = preg_replace('/(\[code\])+(.*?)(\[\/code\])+/ism', '[code]$2[/code]', $s);
133
134                 // Don't show link to full picture (until it is fixed)
135                 $s = BBCode::scaleExternalImages($s);
136
137                 return $s;
138         }
139 }