afl-material: hws/hw04.tex@0eb340948fdb (annotated)

31 e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	1	\documentclass{article}
264 4deef8ac5d72 uodated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 166 diff changeset	2	\usepackage{../style}
292 7ed2a25dd115 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 267 diff changeset	3	\usepackage{../graphics}
146 9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	4
31 e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	5	\begin{document}
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	6
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	7	\section*{Homework 4}
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	8
916 2ab96407f350 texupdate Christian Urban <christian.urban@kcl.ac.uk> parents: 893 diff changeset	9	%%\HEADER
347 22b5294daa2a updated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 294 diff changeset	10
31 e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	11	\begin{enumerate}
34 eeff9953a1c1 tuned Christian Urban <urbanc@in.tum.de> parents: 32 diff changeset	12
726 f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	13	\item Given the regular expressions
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	14
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	15	\begin{center}
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	16	\begin{tabular}{ll}
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	17	1) & $(ab + a)\cdot (\ONE + b)$\\
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	18	2) & $(aa + a)^*$\\
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	19	\end{tabular}
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	20	\end{center}
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	21
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	22	there are several values for how these regular expressions can
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	23	recognise the strings (for 1) $ab$ and (for 2) $aaa$. Give in each case
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	24	\emph{all} the values and indicate which one is the POSIX value.
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	25
f6c2e8c48a1c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 577 diff changeset	26
444 3056a4c071b0 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 401 diff changeset	27	\item If a regular expression $r$ does not contain any occurrence of $\ZERO$,
893 908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	28	is it possible for $L(r)$ to be empty? Explain why, or give a proof.
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	29
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	30	\solution{
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	31	The property to prove is
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	32
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	33	\begin{center}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	34	$P(r)$: If $r$ does not contain $\ZERO$, then $L(r) \not= \emptyset$.
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	35	\end{center}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	36
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	37	For this you have to now go through all cases.
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	38
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	39	Case $r = 0$: $P(\ZERO)$ says: If $\ZERO$ does not contain $\ZERO$
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	40	then \ldots. The premise is obviously false, so everything follows,
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	41	in particular $L(r) \not= \emptyset$.\medskip
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	42
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	43	Case $r = \ONE$ and $r = c$ are similar, just that the premise is
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	44	true, but also $L(\ONE)$ and $L(c)$ are not empty. So we shown
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	45	$L(r) \not= \emptyset$.\medskip
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	46
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	47	Case $r = r_1 + r_2$: We know $P(r_1)$ and $P(r_2)$ as IHs. We need to show
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	48	$P(r_1 + r_2)$: If $r_1 + r_2$ does not contain $\ZERO$, then $L(r_1 + r_2) \not= \emptyset$.
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	49
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	50	If $r_1 + r_2$ does not contain $\ZERO$, then also $r_1$ does not contain $\ZERO$
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	51	and $r_2$ does not contain $\ZERO$. So we can apply the two IHs $P(r_1)$ and $P(r_2)$,
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	52	which allow us to infer that $L(r_1) \not= \emptyset$ and $L(r_2) \not= \emptyset$.
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	53	But if this is the case, then also $L(r_1 + r_2) \not= \emptyset$, which is what we needed
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	54	to show in this case.\medskip
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	55
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	56	The other cases are similar.\bigskip
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	57
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	58
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	59	This lemma essentially says that for basic regular expressions, if
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	60	they do not match anything at all, they must contain $\ZERO$(s)
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	61	somewhere.
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	62
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	63	}
32 d085fe0c086f started Christian Urban <urbanc@in.tum.de> parents: 31 diff changeset	64
264 4deef8ac5d72 uodated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 166 diff changeset	65	\item Define the tokens and regular expressions for a language
267 a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	66	consisting of numbers, left-parenthesis $($, right-parenthesis $)$,
a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	67	identifiers and the operations $+$, $-$ and $*$. Can the following
a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	68	strings in this language be lexed?
264 4deef8ac5d72 uodated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 166 diff changeset	69
267 a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	70	\begin{itemize}
264 4deef8ac5d72 uodated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 166 diff changeset	71	\item $(a + 3) * b$
4deef8ac5d72 uodated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 166 diff changeset	72	\item $)()++ -33$
4deef8ac5d72 uodated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 166 diff changeset	73	\item $(a / 3) * 3$
267 a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	74	\end{itemize}
264 4deef8ac5d72 uodated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 166 diff changeset	75
267 a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	76	In case they can, can you give the corresponding token
a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	77	sequences.
264 4deef8ac5d72 uodated hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 166 diff changeset	78
768 fd7f4f23d4af updated Christian Urban <christian.urban@kcl.ac.uk> parents: 726 diff changeset	79	\item Assume $r$ is nullable. Show that
fd7f4f23d4af updated Christian Urban <christian.urban@kcl.ac.uk> parents: 726 diff changeset	80	\[ 1 + r + r\cdot r \;\equiv\; r\cdot r
fd7f4f23d4af updated Christian Urban <christian.urban@kcl.ac.uk> parents: 726 diff changeset	81	\]
fd7f4f23d4af updated Christian Urban <christian.urban@kcl.ac.uk> parents: 726 diff changeset	82
fd7f4f23d4af updated Christian Urban <christian.urban@kcl.ac.uk> parents: 726 diff changeset	83	holds.
fd7f4f23d4af updated Christian Urban <christian.urban@kcl.ac.uk> parents: 726 diff changeset	84
893 908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	85	\solution{
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	86	If $r$ is nullable, then $1 + r \equiv r$. With this you can replace
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	87
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	88	\begin{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	89	(1 + r) + r\cdot r & \equiv r + r\cdot r\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	90	& \equiv r \cdot (1 + r)\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	91	& \equiv r \cdot r
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	92	\end{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	93
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	94	where in (2) you pull out the ``factor'' $r$ (because $r_1 \cdot (r_2 + r_3) \equiv r_1 \cdot r_2 + r_1 \cdot r_3$).
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	95	}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	96
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	97
938 0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	98	%\item \textbf{(Deleted)} Assume that $s^{-1}$ stands for the operation of reversing a
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	99	% string $s$. Given the following \emph{reversing} function on regular
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	100	% expressions
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	101	%
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	102	% \begin{center}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	103	% \begin{tabular}{r@{\hspace{1mm}}c@{\hspace{1mm}}l}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	104	% $rev(\ZERO)$ & $\dn$ & $\ZERO$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	105	% $rev(\ONE)$ & $\dn$ & $\ONE$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	106	% $rev(c)$ & $\dn$ & $c$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	107	% $rev(r_1 + r_2)$ & $\dn$ & $rev(r_1) + rev(r_2)$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	108	% $rev(r_1 \cdot r_2)$ & $\dn$ & $rev(r_2) \cdot rev(r_1)$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	109	% $rev(r^)$ & $\dn$ & $rev(r)^$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	110	% \end{tabular}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	111	% \end{center}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	112	%
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	113	% and the set
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	114	%
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	115	% \begin{center}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	116	% $Rev\,A \dn \{s^{-1} \;\|\; s \in A\}$
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	117	% \end{center}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	118	%
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	119	% prove whether
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	120	%
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	121	% \begin{center}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	122	% $L(rev(r)) = Rev (L(r))$
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	123	% \end{center}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	124	%
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	125	% holds.
34 eeff9953a1c1 tuned Christian Urban <urbanc@in.tum.de> parents: 32 diff changeset	126
938 0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	127	\item Construct a regular expression that can validate passwords. A
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	128	password should be at least 8 characters long and consist of upper-
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	129	and lower-case letters and digits. It should contain at least a
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	130	single lower-case letter, at least a single upper-case letter and at
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	131	least a single digit. If possible ise the intersection regular
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	132	expression from CW1, written $\_\&\_$, the bounded regular
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	133	expressions; you can also assume a regular expression written
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	134	\texttt{ALL} that can match any character.
31 e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	135
938 0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	136	\solution{
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	137	You can build-up the different constraints separately and then
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	138	use the intersection operator:
32 d085fe0c086f started Christian Urban <urbanc@in.tum.de> parents: 31 diff changeset	139
938 0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	140	\begin{center}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	141	\begin{tabular}{lll}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	142	$ALL^{\{8..\}}$ & \;\&\; & $(ALL^\cdot [a-z]\cdot ALL^)$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	143	& \;\&\; & $(ALL^\cdot [A-Z]\cdot ALL^)$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	144	& \;\&\; & $(ALL^\cdot [0-9]\cdot ALL^)$\\
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	145	\end{tabular}
267 a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	146	\end{center}
938 0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	147	}
0eb340948fdb updated Christian Urban <christian.urban@kcl.ac.uk> parents: 916 diff changeset	148
401 5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	149	\item Assume the delimiters for comments are
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	150	\texttt{$\slash$} and \texttt{$\slash$}. Give a
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	151	regular expression that can recognise comments of the
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	152	form
42 5529cfb2a81e tuned Christian Urban <urbanc@in.tum.de> parents: 34 diff changeset	153
267 a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	154	\begin{center}
a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	155	\texttt{$\slash$~\ldots{}~$\slash$}
a1544b804d1e updated homeworks Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 264 diff changeset	156	\end{center}
42 5529cfb2a81e tuned Christian Urban <urbanc@in.tum.de> parents: 34 diff changeset	157
401 5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	158	where the three dots stand for arbitrary characters, but
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	159	not comment delimiters. (Hint: You can assume you are
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	160	already given a regular expression written \texttt{ALL},
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	161	that can recognise any character, and a regular
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	162	expression \texttt{NOT} that recognises the complement
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	163	of a regular expression.)
355 a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	164
a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	165	\item Simplify the regular expression
42 5529cfb2a81e tuned Christian Urban <urbanc@in.tum.de> parents: 34 diff changeset	166
355 a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	167	\[
401 5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	168	(\ZERO \cdot (b \cdot c)) +
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	169	((\ZERO \cdot c) + \ONE)
355 a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	170	\]
a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	171
401 5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	172	Does simplification always preserve the meaning of a
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	173	regular expression?
355 a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	174
401 5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	175	\item The Sulzmann \& Lu algorithm contains the function
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	176	$mkeps$ which answers how a regular expression can match
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	177	the empty string. What is the answer of $mkeps$ for the
355 a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	178	regular expressions:
146 9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	179
355 a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	180	\[
a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	181	\begin{array}{l}
401 5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	182	(\ZERO \cdot (b \cdot c)) +
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	183	((\ZERO \cdot c) + \ONE)\\
577 1d6043a87a3e updated Christian Urban <urbanc@in.tum.de> parents: 525 diff changeset	184	(a + \ONE) \cdot (\ONE + \ONE)\\
1d6043a87a3e updated Christian Urban <urbanc@in.tum.de> parents: 525 diff changeset	185	a^*
355 a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	186	\end{array}
a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	187	\]
a259eec25156 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 347 diff changeset	188
401 5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	189	\item What is the purpose of the record regular expression in
5d85dc9779b1 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 359 diff changeset	190	the Sulzmann \& Lu algorithm?
498 cd2d192775a4 updated Christian Urban <urbanc@in.tum.de> parents: 444 diff changeset	191
843 f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	192	\item Recall the functions \textit{nullable} and
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	193	\textit{zeroable}. Define recursive functions
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	194	\textit{atmostempty} (for regular expressions that match no
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	195	string or only the empty string), \textit{somechars} (for
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	196	regular expressions that match some non-empty string),
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	197	\textit{infinitestrings} (for regular expressions that can match
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	198	infinitely many strings).
893 908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	199
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	200	\solution{
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	201	\textbf{zeroable}: The property is $z(r) \;\text{iff}\; L(r) = \emptyset$:
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	202
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	203	\begin{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	204	z(\ZERO) &\dn true\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	205	z(\ONE) &\dn false\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	206	z(c) &\dn false\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	207	z(r_1 + r_2) &\dn z(r_1) \wedge z(r_2)\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	208	z(r_1 \cdot r_2) &\dn z(r_1) \vee z(r_2)\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	209	z(r^*) &\dn false
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	210	\end{align}\bigskip
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	211
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	212	\textbf{atmostempty}: The property is ``either $L(r) = \emptyset$ or $L(r) = \{[]\}$'', which
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	213	is more formally $a(r) \;\text{iff}\; L(r) \subseteq \{[]\}$:
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	214
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	215	\begin{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	216	a(\ZERO) &\dn true\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	217	a(\ONE) &\dn true\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	218	a(c) &\dn false\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	219	a(r_1 + r_2) &\dn a(r_1) \wedge a(r_2)\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	220	a(r_1 \cdot r_2) &\dn z(r_1) \vee z(r_2) \vee (a(r_1) \wedge a(r_2))\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	221	a(r^*) &\dn a(r)
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	222	\end{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	223
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	224	For this it is good to remember the regex should either not
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	225	match anything at all, or just the empty string.\bigskip
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	226
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	227	\textbf{somechars}: The property is ``$L(r)$ must contain a string which is not the empty string'', which
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	228	is more formally $s(r) \;\text{iff}\; \exists\,s. s \not= [] \wedge s \in L(r)$:
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	229
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	230	\begin{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	231	s(\ZERO) &\dn false\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	232	s(\ONE) &\dn false\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	233	s(c) &\dn true\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	234	s(r_1 + r_2) &\dn s(r_1) \vee s(r_2)\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	235	s(r_1 \cdot r_2) &\dn (\neg z(r_1) \wedge s(r_2)) \;\vee\; (\neg z(r_2) \wedge s(r_1))\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	236	s(r^*) &\dn s(r)
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	237	\end{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	238
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	239	Here the interesting case is $r_1 \cdot r_2$ where one essentially has to make sure
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	240	that one of the regexes is not zeroable, because then the resulting regex cannot match any
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	241	string.\bigskip
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	242
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	243	\textbf{infinitestrings}: The property is
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	244	$i(r) \;\text{iff}\; L(r)\;\text{is infinite}$:
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	245
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	246	\begin{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	247	i(\ZERO) &\dn false\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	248	i(\ONE) &\dn false\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	249	i(c) &\dn false\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	250	i(r_1 + r_2) &\dn i(r_1) \vee i(r_2)\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	251	i(r_1 \cdot r_2) &\dn (\neg z(r_1) \wedge i(r_2)) \;\vee\; (\neg z(r_2) \wedge i(r_1))\\
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	252	i(r^*) &\dn \neg a(r)
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	253	\end{align}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	254
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	255	Here the interesting bit is that as soon $r$ can match at least a single string, then $r^*$
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	256	will match infinitely many strings.
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	257	}
908e4f6cdf7c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 892 diff changeset	258
498 cd2d192775a4 updated Christian Urban <urbanc@in.tum.de> parents: 444 diff changeset	259
892 4a15a336022c updated Christian Urban <christian.urban@kcl.ac.uk> parents: 843 diff changeset	260	\item There are two kinds of automata that are generated for
843 f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	261	regular expression matching---DFAs and NFAs. (1) Regular expression engines like
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	262	the one in Python generate NFAs. Explain what is the problem with such
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	263	NFAs and what is the reason why they use NFAs. (2) Regular expression
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	264	engines like the one in Rust generate DFAs. Explain what is the
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	265	problem with these regex engines and also what is the problem with $a^{\{1000\}}$
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	266	in these engines.
f3204dd2b6dc updated Christian Urban <christian.urban@kcl.ac.uk> parents: 768 diff changeset	267
146 9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	268	%\item (Optional) The tokenizer in \texttt{regexp3.scala} takes as
9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	269	%argument a string and a list of rules. The result is a list of tokens. Improve this tokenizer so
9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	270	%that it filters out all comments and whitespace from the result.
9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	271
9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	272	%\item (Optional) Modify the tokenizer in \texttt{regexp2.scala} so that it
9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	273	%implements the \texttt{findAll} function. This function takes a regular
9da175d5eb63 added new hws Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 102 diff changeset	274	%expressions and a string, and returns all substrings in this string that
444 3056a4c071b0 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 401 diff changeset	275	%match the regular expression.
3056a4c071b0 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 401 diff changeset	276
3056a4c071b0 updated Christian Urban <christian dot urban at kcl dot ac dot uk> parents: 401 diff changeset	277	\item \POSTSCRIPT
31 e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	278	\end{enumerate}
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	279
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	280
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	281	\end{document}
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	282
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	283	%%% Local Variables:
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	284	%%% mode: latex
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	285	%%% TeX-master: t
e22ba348b209 added hw04 Christian Urban <urbanc@in.tum.de> parents: diff changeset	286	%%% End:

author	Christian Urban <christian.urban@kcl.ac.uk>
	Thu, 05 Oct 2023 10:31:05 +0100
changeset 938	0eb340948fdb
parent 916	2ab96407f350
child 942	7f52427568ff
permissions	-rw-r--r--