<div dir="ltr"><div class="gmail_default" style="font-family:times new roman,serif">The paper points out that the input buffer needs to be padded with 3 null bytes as a precondition.</div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><font face="'times new roman', serif"><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px"><div></div></div><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px"><a href="https://twitter.com/mark_e_davis" style="background-color:transparent;font-size:12.8px" target="_blank">Mark</a></div></font><div><div><font face="'times new roman', serif"><i><span style="font-style:normal"><i></i></span><i></i></i></font></div></div></div></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote">On Mon, Oct 9, 2017 at 10:57 AM, J Decker via Unicode <span dir="ltr"><<a href="mailto:unicode@unicode.org" target="_blank">unicode@unicode.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">that's interesting; however it will segfault if the string ends on a memory allocation boundary.  will have to make sure strings are always allocated with 3 extra bytes.</div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">2017-10-09 1:37 GMT-07:00 Martin J. Dürst via Unicode <span dir="ltr"><<a href="mailto:unicode@unicode.org" target="_blank">unicode@unicode.org</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">A friend of mine sent me a pointer to<br>
<a href="http://nullprogram.com/blog/2017/10/06/" rel="noreferrer" target="_blank">http://nullprogram.com/blog/20<wbr>17/10/06/</a>, a branchless UTF-8 decoder.<br>
<br>
Regards,   Martin.<br>
</blockquote></div><br></div>
</div></div></blockquote></div><br></div>